《機器學習的產業實踐之路》是2023年機械工業出版社出版的圖書。
基本介紹
- 中文名:機器學習的產業實踐之路
- 出版時間:2023年5月1日
- 出版社:機械工業出版社
- ISBN:9787111726159
內容簡介,圖書目錄,作者簡介,
內容簡介
本書是一本人工智慧套用方法論的書,從技術原理、項目實踐到商業戰略再到實踐課,逐層放開視野。第一部分首先圍繞“機器為何學習”和“機器怎樣學習”展開,樹立機器學習的基本觀念,認識大數據對機器學習和深度學習的價值,啟發對產業套用的思考;然後聚焦機器學習和深度學習的技術原理和實踐經驗,詳述“假設+目標+尋解”的學習框架,探討模型如何變強,以及建模的實踐經驗。第二部分以電商促銷策略中的模型、計算機視覺技術和視覺搜尋,以及知識圖譜和對話機器人為案例,展示從業務分析到系統建模的全過程,這是套用技術的項目級實踐。第三部分站在行業和商業的視角審視技術,以套用技術為出發點,構建一個成功的商業模式,是套用技術的商業實踐。第四部分的實踐以數值預測、計算機視覺、自然語言處理領域的經典任務——房價預測、手寫數字識別和語義相似度計算為例,結合產業套用案例,便於讀者更深刻地體會本書介紹的方法論。
本書既有對技術原理的思考,也有對商業套用的總結;既有簡潔的數學公式,也有有趣的哲學思考。本書不追求講解機器學習原理的每個細節,而是通過系統化思考讓讀者輕鬆掌握機器學習的本質和套用方法論。
圖書目錄
前言
第一部分 原理與思考
第1章 機器學習與大數據 2
1.1 機器為何能學習 2
1.1.1 人類為何能學習 2
1.1.2 從個案學習到統計學習 3
1.1.3 統計學習是否可信 5
1.2 機器是怎樣學習的 9
1.2.1 機器學習的框架:假設+目標+尋解 9
1.2.2 如何在機器學習場景中套用大數定律 14
1.2.3 大數據對機器學習的意義 17
1.2.4 小結 20
1.3 跨上人工智慧的戰車 20
1.3.1 大數據的概念及價值 20
1.3.2 企業為何要搭上人工智慧的戰車 24
1.3.3 企業如何搭上人工智慧的戰車 27
1.3.4 人工智慧技術團隊的建設 38
第2章 機器學習框架的深入探討 40
2.1 機器為何能學習(續):故事結束了嗎?我們需要更多的
模型嗎 40
2.1.1 牛頓第二定律的遺留問題 40
2.1.2 新的需求場景 43
2.1.3 不同的目標 49
2.1.4 不同的尋解 54
2.1.5 小結與回顧 60
2.2 重要權衡與過擬合 62
2.2.1 重要權衡的四張“面孔” 62
2.2.2 過擬合的成因和防控 68
2.2.3 小結與回顧 77
第3章 從線性函式到非線性函式,如何構建強大的模型 78
3.1 從線性函式到非線性函式 78
3.1.1 線性模型的不足 78
3.1.2 怎樣擴展假設空間 79
3.2 核函式方法 82
3.2.1 正則化的另一種理解與SVM模型 82
3.2.2 核函式的思路 86
3.3 多模型組合的方法 88
3.3.1 組合模型的兩個好處 88
3.3.2 實現組合模型的兩個步驟和方法 89
3.3.3 裝袋方式 91
3.3.4 提升方式 92
3.3.5 切分方式 93
3.3.6 小結 96
3.4 神經網路與深度學習 97
3.4.1 神經網路和深度學習的模型思路 97
3.4.2 組建神經網路 98
3.4.3 神經網路模型的最佳化 99
3.4.4 非線性變換函式的選擇 102
3.4.5 神經網路結構的選擇 104
3.4.6 深度學習得到發展的前提及其具備的優勢 107
3.4.7 深度學習的重要衍生功能 111
第4章 機器學習的建模實踐 122
4.1 業務建模 122
4.1.1 如何做好業務建模 122
4.1.2 案例:兩個不同的排序模型 124
4.2 特徵工程 128
4.2.1 特徵工程的定義 128
4.2.2 信息可以存儲在特徵中,也可以存儲在模型中 129
4.2.3 特徵工程案例 131
4.2.4 特徵的類型和維度 135
4.2.5 特徵存在缺失或錯誤值時怎么辦 137
4.2.6 特徵降維和選擇 137
4.3 樣本處理 140
4.3.1 訓練樣本的基本概念 140
4.3.2 訓練樣本的常見問題及其解決方案 141
4.4 模型評估 151
4.4.1 業務目標的評估 151
4.4.2 模型目標的評估 155
4.5 小結 170
第二部分 套用與方法
第5章 電商平台促銷策略模型 174
5.1 業務背景 174
5.1.1 網際網路的盈利模式 174
5.1.2 廣告定價機制 175
5.2 傳統的促銷方案 176
5.2.1 問題1:如何選擇促銷時機 177
5.2.2 問題2:如何為店鋪制定廣告消費任務 179
5.2.3 問題3:如何設定優惠定價模型 182
5.3 基於競爭傳播的顛覆創新 190
5.3.1 顛覆創新的思考 190
5.3.2 競爭傳播模型 192
5.3.3 種子集合篩選算法 197
5.4 小結 198
第6章 計算機視覺及其套用產品的構建 199
6.1 計算機視覺產品的問題背景 199
6.2 圖像的特徵表示 200
6.2.1 SIFT特徵 201
6.2.2 CNN模型與特徵 205
6.2.3 實現高速計算的方法:特徵降維 221
6.3 視覺產品的構建案例 223
6.3.1 如何在海量數據中尋找匹配的圖像 223
6.3.2 如何識別和理解圖像中的實體信息 223
6.3.3 其他計算機視覺領域常見任務 233
6.4 計算機視覺套用的產業分析 236
6.4.1 計算機視覺在網際網路行業的套用 237
6.4.2 計算機視覺在傳統行業的套用 243
6.5 小結 245
第7章 知識圖譜和對話機器人 248
7.1 知識圖譜技術 248
7.1.1 兩類信息 248
7.1.2 人工智慧技術的發展歷程 248
7.1.3 什麼是知識圖譜 250
7.1.4 知識圖譜的套用場景 251
7.2 基於知識的人機互動 253
7.2.1 基於領域知識最佳化人機互動策略 253
7.2.2 領域知識的挖掘 257
7.3 對話機器人的產業分析與技術方案 266
7.3.1 技術流派與實現方案 266
7.3.2 技術套用兩大方向 268
7.3.3 技術實現 276
7.3.4 套用MDP和Q-learning算法的案例 283
第三部分 商業與戰略
第8章 認知新技術:區塊鏈 290
8.1 從創造者的視角理解技術 290
8.1.1 貨幣的本質是什麼 292
8.1.2 如何記賬 293
8.1.3 如何保證賬本的真實性 294
8.1.4 如何保證賬本的安全性 294
8.1.5 如何實現分散式存儲的數據同步 295
8.1.6 如何解決記賬的動力 297
8.2 用抽象邏輯梳理套用場景 298
8.2.1 “鏈圈”套用的內在邏輯 298
8.2.2 區塊鏈技術套用的案例 299
8.2.3 區塊鏈技術套用的三個阻礙 303
8.2.4 “鏈圈”套用的總結 306
8.3 “幣圈”套用思想的精要 306
8.3.1 為什麼要發幣 306
8.3.2 為何幣會值錢 307
8.3.3 如何設計發幣 309
8.4 從商業本質來制定戰略 310
第9章 醫療行業的技術布局和套用思考 314
9.1 謀划行業中的技術套用 314
9.2 網際網路醫療平台 315
9.2.1 多種醫藥流通業態逐漸融合 315
9.2.2 網際網路醫療平台與商業保險的合作模式 316
9.3 醫療行業的技術套用分析 317
9.3.1 網際網路套用 318
9.3.2 區塊鏈套用 321
9.3.3 IT軟體和雲計算套用 326
9.3.4 人工智慧套用 330
9.3.5 科技企業進入傳統行業落地AI技術 336
9.4 思考技術在行業套用的方法論 338
第10章 從技術到商業的思考 340
10.1 主題回顧 340
10.2 從技術到商業的思維模式轉變 341
10.3 新型壁壘:平台模式的解析 346
10.4 技術投資與採購的方法論 358
10.5 人工智慧的產業展望 364
10.6 企業的組織能力: 《創新者的窘境》中的理論 370
10.7 人工智慧套用領域的職業前景 372
第四部分 工具與實踐
第11章 實踐課 374
11.1 實踐課1:基於深度學習框架飛槳完成房價
預測任務 374
11.2 實踐課2:手寫數字識別 384
11.3 實踐課3:詞向量和語義相似度 388
11.4 實踐課4:畢業設計 395
作者簡介
畢然
專注於機器學習、人工智慧、數據分析、商業戰略等領域,出品過“大數據分析的道與術”“零基礎實踐深度學習”“機器學習的思考故事”“如何系統化地分析業務和戰略”等系列課程,其中前2個課程著有同名書籍,本書為第3個課程的配套書籍。