大嘴巴漫談數據挖掘(全彩)

大嘴巴漫談數據挖掘(全彩)

《大嘴巴漫談數據挖掘(全彩)》是2014年4月出版的圖書,作者是易向軍。

基本介紹

  • 中文名:大嘴巴漫談數據挖掘
  • 外文名:Big mouth ramble on data mining
  • 地位:史上最容易學的數據挖掘書
  • 作者:易向軍 著
  • 出版時間:2014年4月
圖書信息,內容簡介,編輯推薦,目錄,作者簡介,媒體評論,前言,

圖書信息

書名:嘴巴漫談數據挖掘(全彩)
宣傳語:史上最容易學的數據挖掘書,數據挖掘商業套用、數據化統計分析,信息檢索與數據化運營的人手一本的入門經典
作者:易向軍 著
ISBN:978-7-121-22511-6
出版時間:2014年4月出版
定價:69.00元
頁數:288頁
開本:16開

內容簡介

《大嘴巴漫談數據挖掘(全彩)》從最基本的機率統計學開始,全面、系統、形象而又深入地描述了數據挖掘的基礎概念、套用領域以及常用算法。其中每一種數據挖掘算法都輔以通俗易懂的實例,讀者能夠在直觀性、趣味性中學習算法的具體流程,明白算法的實現過程。通過《大嘴巴漫談數據挖掘(全彩)》的學習,讀者可以對數據挖掘的概念、套用和算法技術有一個清晰的理解和認識,並可以熟悉相關統計學的基本原理。
《大嘴巴漫談數據挖掘(全彩)》適合想從事數據挖掘方面的工作的初學者、數據分析愛好者、分析師,以及一線的數據挖掘開發人員參考閱讀,也適合客戶經理針對如何開展針對性的行銷活動,避免客戶流失而閱讀學習,更適合產品經理閱讀,因為針對如何預測產品的目標用戶,促進用戶活躍和業務有效使用,靠經驗已經不行了,數據才最有說服力,更適合企業管理者將其作為一本通俗易懂的數據挖掘基礎讀物閱讀學習,對下屬的工作方向給予指導,以及適合教師學生數據挖掘課程輔導之用。

編輯推薦

大嘴巴帶你玩轉數據挖掘
讓你知道啤酒君和尿布君為什麼會相遇,大數據的小科普讓你成為“讀心”魔法師!
數據挖掘私人定製 輕鬆掌控再無敵手
拒絕枯燥越過三境 火爆網路瘋狂下載
同作者閱讀推薦:軟體需求十步走——新一代軟體需求工程實踐指南
《大嘴巴漫談數據挖掘(全彩)》內容提要

目錄

目錄
第一境昨夜西風凋碧樹。獨上高樓,望盡天涯路…… /10
1.1數據挖掘簡介 / 11
開篇點題引五問 /12
大數據中求價值 /13
定義概述歸特點 /14
知識決策跨領域 /15
架構特徵多形式 /17
數據立方展多維 /19
功能挖掘四大類 /22
分類刻畫類標識 /23
數據聚類辨親疏 /24
預測未來訓模型 /25
關聯源自購物籃 /27
模型過程方法論 /28
十大算法成經典 /32
1.2數據挖掘套用 /33
行業推廣多套用 /34
用戶為王放心中 /36
指導運營全周期 /37
定位目標尋用戶 /38
精準行銷成閉環 /39
交叉產品有關聯 /40
細分用戶刻畫像 /41
用戶體驗模型化 /43
指標評測建體系 /44
流失預警保用戶 /45
跟蹤評估驗效果 /47
第二境衣帶漸寬終不悔,為伊消得人憔悴…… /48
2.1機率定義 /49
浮生難料盡偶然 /50
一枚硬幣拋正反 /51
引出隨機小試驗 /53
樣本空間樣本點 /54
事件三分包萬象 /55
試驗頻率需頻繁 /58
次數無限值極限 /59
描述機率定特點 /60
古典概型等可能 /61
事件B後A在前 /62
求出機率稱條件 /65
獨立事件A和B /67
抽籤中獎公平性 /71
常用機率兩公式 /76
交空並全劃樣本 /77
綜合狀態全機率 /78
前因後果貝葉斯 /80
2.2隨機變數 /81
隨機試驗數量化 /82
統計規律雙類型 /83
離散變數分布律 /84
硬幣拋擲是一零 /85
分布函式連續型 /87
函式求導得密度 /89
高斯分布稱正態 /91
標準正態分位點 /95
2.3數字特徵 / 98
隨機變數有特徵 /98
平均取值是期望 /100
方差衡量偏離值 /101
標準開根同量綱 /103
變數關係協方差 /104
相關係數相關度 /105
研究總體要抽樣 /108
抽樣分布統計量 /109
2.4參數估計 /111
最小二乘估參數 /112
極大似然大機率 /116
區間估計置信度 /119
2.5假設檢驗 / 123
總體假設來檢驗 /124
服從正態抽樣本 /125
統計量中驗假設 /126
棄真取偽兩錯誤 /127
顯著檢驗小機率 /128
小機率中拒絕域 /130
檢驗流程出決策 /131
已知總體方差值 /132
檢驗中驗均值 /133
第三境眾里尋她千百度,驀然回首,那人卻在,燈火闌珊處。 /134
3.1關聯規則 / 135
購物籃中找關聯 /136
數據事務若干項 /137
事務空間含項集 /138
置信支持提升度 /142
規則源於頻繁項 /145
k項連線和剪枝 /146
生成非空規則集 /148
關聯效果來評估 /149
3.2決策樹 /155
決策思維成樹形 /156
分類預測工作流 /161
原理基於信息熵 /162
信息增益條件熵 /164
節點拆分選特徵 /170
3.3貝葉斯 /186
預測分類貝葉斯 /187
類別機率要最大 /188
分類數據新預測 /195
3.4聚類分析 / 196
物以類聚人以群 /197
樣本變數定矩陣 /198
R型Q型換空間 /199
距離度量相似度 /200
係數聚類統計量 /202
標準樣本選歐氏 /203
層次聚合歸大類 /205
3.5神經網路 /209
神經網路神經元 /210
神經元中有加權 /211
輸入映射輸出層 /213
求出誤差調參數 /214
權重偏置學習率 /216
實例分析模型流 /217
3.6線性回歸 /222
研究身高引回歸 /223
單自變數歸一元 /224
最小二乘估回歸 /226
數據差異總離差 /228
分為解釋和誤差 /229
判定係數擬合度 /230
多元回歸建方程 /231
回歸面中展二元 /233
求得回歸係數解 /234
衡量擬合驗效果 /236
3.7邏輯回歸 /237
因變數中二分類 /238
二項邏輯回歸式 /240
極大似然解方程 /242
預測分類符合率 /244
3.8因子分析 /245
相關變數納因子 /246
因子構造築模型 /248
因子載荷統計性 /251
衡量信息共同度 /252
方差貢獻重要性 /253
因子分析四步曲 /254
構造因子求載荷 /255
旋轉因子得命名 /260
因子組合求得分 /265
3.9信度分析 /268
設計問捲來調研 /269
信度檢驗可靠性 /270
3.10效度分析 /272
結構方程協方差 /273
測量模型內外生 /276
結構模型潛變數 /279
效度分析路徑圖 /280
提出假設依理論 /281
固定負荷識模型 /282
相關陣中估參數 /283

作者簡介

易向軍:北京科技大學計算機碩士學歷,長期工作於網際網路和電信領域,目前創辦dazui8com,致力於數據挖掘知識的宣傳推廣以及相關技術的研發探索。新浪微博: @易向軍-數據
淺醉斛觴意漸亂,浮生聚散人堪愁

媒體評論

讀者熱評:
既有漫畫小插圖,又有七絕或者七律打油詩,相當的簡明易懂啊。多次出場的啤酒君和尿布君,相當有喜感。但是看著看著就變成了機率統計教科書了有木有——貝葉斯、高斯。多希望我在考研前看到這本書啊,會對我的數學考試有幫助吧!——展展
看了這本書,確有解惑醒腦之功效,作者很明白我們這些科技小白的理解能力,不敢把話說得太專業,確實通俗易懂,深入淺出,層層推進,讓初學者都有很強的興趣學進去,對只想做了解的同學來說也不難接受,算是很好的科普作品了。——大雄不貳
漫談類,減少了大數據的枯燥,感覺看一遍還不能及時消化,有空再慢慢精讀一下。——楊旭彬
把數據挖掘寫得深入淺出,很容易讀懂,實用性強。——傅志華
書中關於數據挖掘章節的介紹,我特別喜歡,畢竟在數據爆炸的今天,只有從數據中找到別人沒發現的亮點才是關鍵。——由子木
這本書非常值得每一個對數據感興趣的人士細細研讀!
李洪宇
很是喜歡易老師的這種寫書風格,可以讓我們輕鬆地學到知識,超讚!
駱彬
把複雜的統計知識和數據挖掘算法用圖形化後,就很適合作為科普型的數據挖掘入門書籍,好乾貨!——麒程
比較簡單,每個點都可以自行擴展學習,就像個全面的大字典目錄一樣,通讀此書後,可以很好地把握常規的數據挖掘知識和思想。
金石頭
總體來說通俗易懂,有一些總結和圖片很有助於理解,總之是能把數據挖掘這種相對枯燥的東西讓人讀下去,這樣來說總體是非常不錯的。——Woozy
通俗易懂,在圖形中將晦澀的理論清晰化,好書!值得推薦!

前言

數據挖掘,作為大數據時代的關鍵技術及核心內容,其套用價值與日俱增。本書希望能夠成為一本涵蓋最廣泛讀者客群的科普型數據挖掘入門讀物,並傳遞一種知識圖形化的書寫理念,以圖形化的展現、言簡意賅的語言、通俗易懂的實例來描述複雜的機率統計知識和數據挖掘常用算法,使得讀者在新穎性、趣味性和直觀性中讀完本書後,對於數據挖掘的整體架構和關鍵知識點有所理解和掌握。複雜問題的圖形簡約化表示是本書的主要特點。
為什麼要寫作本書
一般來說,學習數據挖掘要求讀者已經具備一定的專業水平和相關技能。本書從最基本的機率統計開始,由淺入深,由易到難,由總到分,使得普通讀者也能夠了解和掌握常規的數據挖掘理論和知識。
管理者:雖不用到一線從事具體的數據分析工作,但也需要一本通俗易懂的數據挖掘基礎讀物,通過學習能夠對下屬的工作方向給予指導。
客戶經理:如何開展針對性的行銷活動,避免客戶流失,這都需要數據挖掘知識。
產品經理:如何促進產品的用戶活躍和業務的有效使用,不僅要靠經驗,數據才最有說服力。
工程師:一線的數據挖掘開發人員必然要掌握的。
分析師:撰寫經營分析報告數據挖掘知識必不可少。
教師:數據挖掘的參考書。
學生:想從事數據分析和挖掘方面的工作,肯定是要學習的。
數據分析愛好者:一本通俗易懂的入門讀物。
本書主要內容
本書基本上涵蓋了學習數據挖掘需要掌握的大部分核心知識點,分為三境17章。第一境總體介紹數據挖掘概況和套用領域,第二境講解基本機率統計知識,第三境具體描述了數據挖掘常用的十大算法。
致謝
本書的順利出版離不開電子工業出版社博文視點編輯老師們的辛勤工作,在此表示最誠摯的感謝!
同時,對於本書的創作形式和書寫理念,本書的出版人孫學瑛女士給予了最大的支持和保留,並提供了大量的指導和幫助。衷心感謝孫老師對本書的重視和欣賞,以及為本書出版所做的一切,並將終身難忘!
由於作者水平有限,書中不足及錯誤之處在所難免,敬請專家和讀者給予批評指正。
易向軍
2014年3月

相關詞條

熱門詞條

聯絡我們