《大數據思維——從擲骰子到紙牌屋》是2016年8月電子工業出版社出版的圖書,作者是馬繼華。
基本介紹
- 書名:大數據思維——從擲骰子到紙牌屋
- 作者:馬繼華
- ISBN:978-7-121-29407-5
- 頁數:280頁
- 定價:55.00元
- 出版社:電子工業出版社
- 出版時間:2016年8月
內容簡介,內容提要,目錄,前言,
內容簡介
數據分析不在於你掌握了多少先進的軟體工具,也不在於你擁有多么高智商的頭腦,而是要靠更大視野、更寬角度和更具有邏輯性的思維。《大數據思維——從擲骰子到紙牌屋》不是一本介紹大數據概念的流行讀物,也不是開講編程工具高深理論的專業教材,而是立足於大數據之上的思維模式的普及。讀者不需要任何統計學知識,也沒必要掌握複雜的公式與算法,在最通俗易懂的案例介紹和娓娓道來中就可以輕鬆理解大數據分析的基本模式與方法。
內容提要
數據分析不在於你掌握了多少先進的軟體工具,也不在於你擁有多么高智商的頭腦,而是要靠更大視野、更寬角度和更具有邏輯性的思維。《大數據思維——從擲骰子到紙牌屋》不是一本介紹大數據概念的流行讀物,也不是開講編程工具高深理論的專業教材,而是立足於大數據之上的思維模式的普及。讀者不需要任何統計學知識,也沒必要掌握複雜的公式與算法,在最通俗易懂的案例介紹和娓娓道來中就可以輕鬆理解大數據分析的基本模式與方法。
作為讀者,你可以是大中專院校的數據分析專業學生,也可以是企事業單位的經營分析人員,或者是任何行業任何職業中喜歡“頭頭是道”的分析愛好者。開卷有益,即便你從來不需要大數據,也可以《大數據思維——從擲骰子到紙牌屋》書中領悟到思維魔力,因此讓工作與生活更充滿智慧與樂趣。
目錄
第 1 章大數據與人腦的較量1
BAT 為何如此了解我們2
大數據預測世界盃真的很準嗎10
數據分析的五個基礎16
結構化思維與分析的類別26
人腦在大數據時代並沒有過時30
相親是感性的還是理性的37
第 2 章大數據看起來是無所不能45
從三隻麻雀之死看大數據的起源46
大數據會讓我們失去做夢的權力嗎51
運營商的大數據為何抱著金碗要飯吃56
大數據方法真能解決交通擁堵嗎61
德國足球隊中的“第十二人” 66
大數據之下,人而無信,不知其可也69
大數據助傳統銀行涅槃重生77
用大數據方法保護大數據的安全80
大數據讓運營商成為旅遊業的智囊87
第 3 章七種必備的大數據思維91
從 1-0≠8-7 開始說起92
統計,一門與賭博密不可分的技術95
串聯,一種簡單實用的日常分析法99
對比,最常用也最實用的分析方法102
拆分,庖丁解牛之後的透視116
合成,組合起來的魅力125
邏輯與反證,大視野大轉換下的推理128
京東淨營收雙降,危險真的降臨了嗎134
大數據分析的關鍵在於有用138
第 4 章分析方法的全聚合141
匯總與排序,你離不開的142
誰說比例與頻次不是分析145
平均數里隱藏的大秘密152
方差,也許你不用關注,但還是要理解更好156
大數據時代的相關關係和因果關係157
回歸分析,你必須學會的分析方法165
聚類、判別和因子分析172
樓市命懸“一線”,“剛需”去哪裡了180
大數據分析可能用到的軟體184
第 5 章大數據,有時候很奇葩189
看懂經濟形勢,奇葩大數據靠譜嗎190
我國航班正點率屬國際中上水平193
為什麼網際網路專車會造成城市擁堵197
坐飛機最危險的階段是去機場的路上203
中醫治未病,大數據四法助你看透 P2P 投資風險207
你會叫個外賣給丈母娘拜年嗎211
第 6 章善用數據,但別自作聰明215
收集情報和信息的幾種方法216
球探與中國足球的屢戰屢敗221
網路資料的鑑別與識別謠言224
網上的這些分析都是忽悠,你中招過嗎228
為什麼生兒子的司機車險出險率比生女兒的高234
大數據行銷不能自作聰明,別小瞧你的消費者236
第 7 章換個角度,讓結論海闊天空241
如何看不同的趨勢圖242
人均預期壽命提高,你真能多活一歲? 245
跳樓?數據也會說假話250
一道被改過的阿里巴巴面試題257
樓市危急,農民工如何去救開發商260
模型都是靠不住的,挑戰短板理論264
大數據也有做不到的事266
前言
早就想寫一本關於數據分析的書,最主要的原因就是,自己是統計專業畢業,又從事過多年數據分析的工作。工作幾經變遷,現在已經很少用軟體重操舊業,但卻越來越感覺到數據分析的重要性。
經常看網路、電視和報紙上的很多分析,在信誓旦旦的說教與言之鑿鑿的數字之外,很多卻是慘不忍睹的分析過程,甚至說是誤人子弟也不為過。因為自媒體的流行,很多人根本沒有基本的分析方法和技巧,在違背常理的情況下做出了很多奇異的解釋,將大家引導到錯誤的方向。
最為可笑的,曾經有一次看到某知名報紙上的文章,分析的是中國信息分類領域的兩家網際網路巨頭:58 同城與趕集網(這兩家公司在2015 年宣布合併)。當時,58 同城剛剛上市,這家報紙的專欄作者發表了一篇針對性的分析文章,文中稱,他查閱了ALEX 網站,58 同城的流量排名在世界網站的第300 名,而趕集網排名是第900 名。於是,這位作者就果斷地下結論說,以上數據足以證明58 同城的網路流量是趕集網的3 倍。嗚呼,如此分析竟然逃過了多少編輯的眼睛,甚至還被眾多讀者接受,是多么可悲!
在實際工作中,一些人雖然科班畢業,通曉各種分析工具,甚至對各種各樣的軟體如數家珍,編程造模輕車熟路,但卻對具體的分析套路與方法形同陌路,只能機械刻板地對數字結論進行解讀。實際上,這樣的數據分析還不如不做,錯誤的分析和錯誤的解讀同樣都是害人不淺。
當然,由於分析能力不到位,讓自己吃虧上當丟人的案例更是不勝枚舉。中國足協就是典型案例。2013 年,人所共知的原因,中國足球終於迎來了出人頭地的機會,中國足協更是喜出望外。為了配合隆重的節日氣氛,也是要彰顯一下中國足球有雄起的能力,中國足協費盡心思地組織了一場國際足球友誼賽。
中國足協應該在邀請友誼賽的對手方面煞費苦心。邀請德國隊?肯定不行,嚴謹的德國人不明就裡的職業精神會破壞比賽氣氛。邀請西班牙隊?鼎盛時期的西班牙與中國隊比賽也必須讓自己有一個可以接受的成績,否則被人笑掉大牙。於是,中國足球邀請了我們的近鄰,泰國隊,可怕的比賽開始了。估計包括中國足協官員在內的中國球迷都沒有想到,一場友誼賽進了6 個球,更重要的是,我們只進了一個,泰國隊進了5 個。
如果中國足協進行了充分的數據分析,也許就會避免這場悲劇的發生。歷史數據證明,中國隊此前已經多年沒有勝過泰國隊。如今的中國隊不再是以前的那支“中國頭球隊”,依靠身高與體重就可以戰勝東南亞球隊,幾年來學西班牙控制腳下球的中國隊既沒有學到技術,也忘記了本分,對付泰國這樣的小老虎已經心有餘而力不足。或者,這場比賽還不如邀請韓國,場面也不會失控。
如果我們非要挖苦一下數學水平奇差的中國足協,那也是可以的。因為,某年某月某日的世界盃外圍賽亞洲區預選賽,中國與黎巴嫩同組,在最後一輪比淨勝球決定出線的關鍵時刻,中國足協竟然鬼使神差地算錯了賬。當全場球迷因為中國隊 7∶0 戰勝中國香港而成功驚險獲得出線權而歡呼的時候,足協才明白過來, 8∶0 才出線,我們已經被淘汰出局。這樣的數據分析能力怎有能力讓中國足球拿下大力神杯?
從歷史上看,中國一直不是一個靠數據化進行管理的國家,我們太多的中庸之道和模糊分辨,“好好好”、“是是是”、“差不多”,貫穿著經濟和社會管理的始終,這個模式也對中國的國家統計局產生著潛移默化的影響,也直接造成了人們對國家統計機構數字的不信任。
數據分析是每個人生活與工作的基本功,小時候對父母的察言觀色也是在分析,長大以後的相親娶妻也要分析,工作中的匯報決策更需要分析,炒股理財也離不開分析。數據分析無處不在,數據分析無時不在,數據分析伴隨我們生命的始終。
我們生活的世界變化是如此之快。電力引入美國 46 年後,才覆蓋1/4 國民;電話花了 35 年;電視機 26 年;寬頻呢?只用了 6 年。 2007年,數碼世界容納了 2810 億 GB 的數據,全球平均每人 45GB,數碼資料首次超越保存空間總量,目前,網際網路每小時處理的數據量已經超過 1EB。
要給美國國會圖書館填滿逾 5700萬份手稿、2900萬冊書籍和期刊、1200 萬張照片及其他,需時 2 個世紀,現在全球每日生成的數碼資料幾乎是這些的 100 倍。人類 5000 年的文字記載總共是 5EB,今後每年將產生的數字內容超過 1000EB。
我們所擁有的數據量在海量暴增,我們認識世界的水平也在不斷提高。大數據時代來了,我們的思維是不是也應該有所改變?