內容簡介
《備滲騙大數據智慧型核心技術入門:從大數悼重櫃鑽據到人工智慧》跟從大數據和人工智慧套用的融合之路,通過分析和解讀整個數據驅動智慧型核心技術,希望能給讀者提供一個大數據智慧型核心技術體系的入門學習和套用參考指南。本書前半部分內容重在核心技術解讀:包全催括大數據智慧型的概論、大數據智慧型核心技術體系的多維解讀、深度學習關鍵技術要點的分析,大數據智慧型套用三段論和敏捷大數據方法論的提出等內容。後半部分內容重在套用實踐的探討,深入分析了當前大數據智慧型獨角獸Palantir、AlphaGo、Watson等核心產品和技術,並從個人學習到工程實踐,從企業套用到政府治理,從業務理解到技術選型漏葛危等多個層面,逐一解讀大數據智慧型技術在學習、套用過程中面臨的關鍵問題、陷阱,並給出參考意見。本書通過核心技術解讀幫助讀者學習、理解、套用大數據智慧型,具有重要的參考價值。本書適合的讀者包括關注大數據和人工智慧相關技術領域的在校學生、個人學習者和研發工程師、技術主管、企業高管、政府管理人員等。
作者簡介
杜聖東,西南交通大學信息科學與技術學院(人工智慧研究院),講師,大數據與人工智慧方向在職博士,碩士與本科畢業於重慶大學計算機學院。兼任多家單位技術顧問和大數據培訓專家,曾為中國中車集團、廣州捷運集團、成都鐵路局等多家企事業單位做大數據和人工智慧培訓講座。首次提出了敏捷大數據方法論,在數據再檔組台挖掘、商業智慧型、機器學習和交通、政務、醫療大數據等領域有10餘年的系統研發、管理與諮詢經驗。迄今為止,主研國家自然科學基金和國家重點研發計畫項目4項、主持企業課題和產品研發20餘項,獲得專利和軟體著作權6項,發表論文10餘篇。
目錄
第1章 大婆炒埋數據智慧型概論 1
1 大數據現象的本質 1
大數據源起:先知的誘惑 1
從《琅琊榜》看大數據本質 3
2 大數據是個“筐”,什麼都能往裡裝 5
大數據技術業務概覽 6
為什麼叫大數據智慧型 7
3 何謂大數據智慧型 7
圖靈的智慧型之問 7
大數據如何助力人工智慧 9
大數據智慧型的深度融合之路 11
4 大數據智慧型三要素 12
數據:智慧型燃料 13
算法:智慧型引擎 14
算力:智慧型加速 15
5 大數據智慧型的馬太效應 16
DT技術新解 16
強者越強,弱者越弱 18
挑戰才剛剛開始 19
第2章 多維度解構大數據智慧型技術 21
1 “四位一體”看大數據智慧型 21
大數據智慧型技術的四個維度 22
雲計算的支撐地位 24
2 大數據智慧型產業鏈版圖 26
百家爭鳴的DT生態 27
開源的巨大推動力 29
3 大數據智慧型的關鍵技術體系 31
大數據智慧型總體套用架構 31
大數據智慧型的基礎支撐技術 34
大數據智慧型套用流程最佳化 39
4 從數據科學看大數據智慧型 43
什麼是數據科學 43
數據科學的核心技術 44
數據科學的技術體系 47
數據科學的藝術 48
5 從商業智慧型看大數據智慧型 50
商業智慧型套用的問題 50
BI如何借力大數據智慧型 52
大數據智慧型與BI的融合之路 53
6 智慧型時代的基礎信息架構 54
DT基礎設施:雲端―數據―智慧型 54
Hadoop大數據管理:“三個臭皮匠,賽過諸葛亮” 55
OpenStack雲計算:一切皆服務 58
TensorFlow深度學習:流動的張量 59
第3章 大數據驅動的深度智慧型 63
1 深度學習的崛起 63
早期AI的發展 64
“貓”“狗”AI的野蠻生長 65
深度學習正在重塑機器智慧型 69
2 機器如何智慧型:從感知到認知 70
何謂機器智慧型 70
機器智慧型的三個層次 71
智慧型技術及套用體系 72
3 機器如何學習:從知識到數據 73
符號派AI的瓶頸 73
淺層學習:小數據驅動的機器學習1.0 76
深度學習:大數據驅動的機器學習2.0 83
4 機器學習五大學派 84
機器學習主流方向 84
機器學習算法不完全概覽 87
機器學習技術選型 88
5 神經網路的“三起兩落” 90
神經元與神經網路 90
神經網路研究的泡沫與價值 92
6 深度學習原理及核心網路結構 94
機器如何深度學習 94
自動特徵工程:抽象與疊代 96
深度學習的關鍵字 97
深度學習的主流網路結構 100
7 深度強化學習:深度感知+強化決策 108
什麼是強化學習 108
AlphaGo的深度強化策略 109
8 深度學習的“深度”價值 110
類腦學習參考 111
無監督自動特徵工程 112
多種學習方式的融合 112
9 深度學習的瓶頸與挑戰 113
如何從感知到戒判籃認知 114
如何從監督學習到無監督學習 114
學習方式及套用場景的局限 115
多模態、多任務增量學習和模型重用 116
可解釋性、安全性與魯棒性 116
大數據、大模型與計算資源的瓶頸 118
第4章 敏捷大數據智慧型 121
1 為什麼需要敏捷 121
大數據套用落地的瓶頸 121
敏捷大數據的重要性 123
2 敏捷大數據方法論 126
精益與敏捷思想 127
敏捷大數據定義及核心原則 130
“大”數據“小”套用 132
敏捷大數據套用流程 132
3 微服務、容器與數據融合 134
微服務與容器技術 134
多層次數據融合技術 137
4 敏捷大數據智慧型技術架構 139
5 結論與展望 144
第5章 大數據智慧型“獨角獸”探秘 146
1 Palantir的本體人機共生 146
B2B大數據領域的“獨角獸” 146
Palantir的產品體系及套用案例 147
Palantir架構設計:敏捷大數據的優美實現 151
Palantir數據融合:本體論與數據索引映射 152
Palantir智慧型計算:多維關聯挖掘與全鏈分析 155
Palantir人機互動:動態可視化與人機共生 156
總結與啟示 158
2 Google的深度智慧型樣板工程 159
“狗”的誕生 160
AlphaGo的“類腦學習”框架 160
AlphaGo“零”的進化 162
總結與啟示 164
3 IBM的認知智慧型 164
Watson的源起 165
認知智慧型與自然語言理解 166
Watson的認知智慧型平台架構 168
Watson DeepQA關鍵技術 169
Watson認知智慧型的強與弱 171
總結與啟示 172
4 TensorFlow的Android式進化 173
TensorFlow的開源 173
為什麼要講Android 174
Google雲端大數據智慧型戰略 175
總結與啟示 177
第6章 大數據智慧型個人學習篇:入門與實踐 178
1 智慧型時代的學習革命 178
機器智慧型的助力 178
牛津大學的職業淘汰率研究 179
2 大數據智慧型技術“盲人摸象” 181
3 大數據智慧型“3+3”學習路線 183
學習的三個階段:把握技術發展的時間線 183
學習的三種方式:套用導向是關鍵 186
4 如何避免大數據智慧型學習的誤區 189
要業務驅動,不要技術驅動 189
要以點帶面,不要貪大求全 190
要善用開源技術,不要重“造輪子” 191
要勇於實踐,不要紙上談兵 192
5 Kaggle,眾包與大數據教育 193
6 三種核心職業角色 194
數據分析師:重在業務理解和探索 196
數據工程師:重在數據管理和系統實現 196
數據科學家:重在解決問題和統籌決策 197
7 理性看待所謂的“風口” 198
第7章 大數據智慧型企業套用篇:戰略與規劃 201
1 智慧型時代的商業革命 201
2 大數據智慧型套用全周期模型 203
3 如何避免大數據智慧型套用的陷阱 207
第一問:我屬於什麼級別的“玩家” 207
第二問:大數據於我是偽需求還是真需求 207
第三問:如何自行定位大數據套用價值 208
第四問:技術驅動、數據驅動還是業務場景驅動 209
第五問:我是否準備好打一場大數據套用持久戰 210
第六問:我是否清楚大數據偏見、技術局限與管理風險 213
4 大數據套用戰略 214
第8章 大數據智慧型政府管理篇:治理與決策 217
1 智慧型時代的治理革命 217
2 政務大數據治理挑戰 218
第一問:如何處理集中與開放的矛盾 219
第二問:如何推進政務大數據治理和決策最佳化 219
第三問:如何降低政務數據治理帶來的負面影響 220
3 政務大數據治理與套用框架 220
管理和治理是基礎 221
技術和算法是手段 222
決策和服務是目的 223
4 政務大數據決策安全 224
國防決策安全 224
公共決策安全 224
經濟決策安全 225
科技決策安全 226
5 套用標準與落地套用的悖論 226
數據安全標準 227
數據質量標準 227
數據互動標準 227
數據開放標準 228
6 政務治理的現代化 228
第9章 結語 230
1 認知泡沫與套用價值 230
2 機器智慧型與人類智慧型 231
3 人技融合,學以“治”用 234
4 智慧型時代,我們將走向何方 235
致謝 236
數據科學的技術體系 47
數據科學的藝術 48
5 從商業智慧型看大數據智慧型 50
商業智慧型套用的問題 50
BI如何借力大數據智慧型 52
大數據智慧型與BI的融合之路 53
6 智慧型時代的基礎信息架構 54
DT基礎設施:雲端―數據―智慧型 54
Hadoop大數據管理:“三個臭皮匠,賽過諸葛亮” 55
OpenStack雲計算:一切皆服務 58
TensorFlow深度學習:流動的張量 59
第3章 大數據驅動的深度智慧型 63
1 深度學習的崛起 63
早期AI的發展 64
“貓”“狗”AI的野蠻生長 65
深度學習正在重塑機器智慧型 69
2 機器如何智慧型:從感知到認知 70
何謂機器智慧型 70
機器智慧型的三個層次 71
智慧型技術及套用體系 72
3 機器如何學習:從知識到數據 73
符號派AI的瓶頸 73
淺層學習:小數據驅動的機器學習1.0 76
深度學習:大數據驅動的機器學習2.0 83
4 機器學習五大學派 84
機器學習主流方向 84
機器學習算法不完全概覽 87
機器學習技術選型 88
5 神經網路的“三起兩落” 90
神經元與神經網路 90
神經網路研究的泡沫與價值 92
6 深度學習原理及核心網路結構 94
機器如何深度學習 94
自動特徵工程:抽象與疊代 96
深度學習的關鍵字 97
深度學習的主流網路結構 100
7 深度強化學習:深度感知+強化決策 108
什麼是強化學習 108
AlphaGo的深度強化策略 109
8 深度學習的“深度”價值 110
類腦學習參考 111
無監督自動特徵工程 112
多種學習方式的融合 112
9 深度學習的瓶頸與挑戰 113
如何從感知到認知 114
如何從監督學習到無監督學習 114
學習方式及套用場景的局限 115
多模態、多任務增量學習和模型重用 116
可解釋性、安全性與魯棒性 116
大數據、大模型與計算資源的瓶頸 118
第4章 敏捷大數據智慧型 121
1 為什麼需要敏捷 121
大數據套用落地的瓶頸 121
敏捷大數據的重要性 123
2 敏捷大數據方法論 126
精益與敏捷思想 127
敏捷大數據定義及核心原則 130
“大”數據“小”套用 132
敏捷大數據套用流程 132
3 微服務、容器與數據融合 134
微服務與容器技術 134
多層次數據融合技術 137
4 敏捷大數據智慧型技術架構 139
5 結論與展望 144
第5章 大數據智慧型“獨角獸”探秘 146
1 Palantir的本體人機共生 146
B2B大數據領域的“獨角獸” 146
Palantir的產品體系及套用案例 147
Palantir架構設計:敏捷大數據的優美實現 151
Palantir數據融合:本體論與數據索引映射 152
Palantir智慧型計算:多維關聯挖掘與全鏈分析 155
Palantir人機互動:動態可視化與人機共生 156
總結與啟示 158
2 Google的深度智慧型樣板工程 159
“狗”的誕生 160
AlphaGo的“類腦學習”框架 160
AlphaGo“零”的進化 162
總結與啟示 164
3 IBM的認知智慧型 164
Watson的源起 165
認知智慧型與自然語言理解 166
Watson的認知智慧型平台架構 168
Watson DeepQA關鍵技術 169
Watson認知智慧型的強與弱 171
總結與啟示 172
4 TensorFlow的Android式進化 173
TensorFlow的開源 173
為什麼要講Android 174
Google雲端大數據智慧型戰略 175
總結與啟示 177
第6章 大數據智慧型個人學習篇:入門與實踐 178
1 智慧型時代的學習革命 178
機器智慧型的助力 178
牛津大學的職業淘汰率研究 179
2 大數據智慧型技術“盲人摸象” 181
3 大數據智慧型“3+3”學習路線 183
學習的三個階段:把握技術發展的時間線 183
學習的三種方式:套用導向是關鍵 186
4 如何避免大數據智慧型學習的誤區 189
要業務驅動,不要技術驅動 189
要以點帶面,不要貪大求全 190
要善用開源技術,不要重“造輪子” 191
要勇於實踐,不要紙上談兵 192
5 Kaggle,眾包與大數據教育 193
6 三種核心職業角色 194
數據分析師:重在業務理解和探索 196
數據工程師:重在數據管理和系統實現 196
數據科學家:重在解決問題和統籌決策 197
7 理性看待所謂的“風口” 198
第7章 大數據智慧型企業套用篇:戰略與規劃 201
1 智慧型時代的商業革命 201
2 大數據智慧型套用全周期模型 203
3 如何避免大數據智慧型套用的陷阱 207
第一問:我屬於什麼級別的“玩家” 207
第二問:大數據於我是偽需求還是真需求 207
第三問:如何自行定位大數據套用價值 208
第四問:技術驅動、數據驅動還是業務場景驅動 209
第五問:我是否準備好打一場大數據套用持久戰 210
第六問:我是否清楚大數據偏見、技術局限與管理風險 213
4 大數據套用戰略 214
第8章 大數據智慧型政府管理篇:治理與決策 217
1 智慧型時代的治理革命 217
2 政務大數據治理挑戰 218
第一問:如何處理集中與開放的矛盾 219
第二問:如何推進政務大數據治理和決策最佳化 219
第三問:如何降低政務數據治理帶來的負面影響 220
3 政務大數據治理與套用框架 220
管理和治理是基礎 221
技術和算法是手段 222
決策和服務是目的 223
4 政務大數據決策安全 224
國防決策安全 224
公共決策安全 224
經濟決策安全 225
科技決策安全 226
5 套用標準與落地套用的悖論 226
數據安全標準 227
數據質量標準 227
數據互動標準 227
數據開放標準 228
6 政務治理的現代化 228
第9章 結語 230
1 認知泡沫與套用價值 230
2 機器智慧型與人類智慧型 231
3 人技融合,學以“治”用 234
4 智慧型時代,我們將走向何方 235
致謝 236