《圖解深度學習:可視化、互動式的人工智慧指南》是2022年人民郵電出版社出版的圖書,作者是喬恩·克羅恩(Jon Krohn)。
基本介紹
- 中文名:圖解深度學習:可視化、互動式的人工智慧指南
- 作者:喬恩·克羅恩(Jon Krohn)
- 出版時間:2022年12月
- 出版社:人民郵電出版社
- ISBN:9787115591531
- 類別:圖書>計算機/網路>人工智慧>深度學習與神經網路
- 開本:128 開
- 裝幀:平裝-膠訂
內容簡介,圖書目錄,作者簡介,
內容簡介
本書利用精美的插圖和有趣的類比,對深度學習的主流技術和背後的原理進行了深入淺出的講解,解釋了什麼是深度學習,深度學習流行的原因,以及深度學習與其他機器學習方法的關係。閱讀本書,讀者可以掌握卷積神經網路、循環神經網路、生成對抗網路和深度強化學習等熱門技術,學習 TensorFlow、Keras 和 PyTorch 等熱門工具的使用,同時能夠更深刻地理解計算機視覺、自然語言處理和遊戲等領域的人工智慧套用。本書還提供了簡單明了的示例和代碼,能夠幫助讀者動手實踐。
圖書目錄
第Ⅰ部分 深度學習簡介 1
第 1章 生物視覺與機器視覺 2
1.1 生物視覺 2
1.2 機器視覺 6
1.2.1 神經認知機 7
1.2.2 LeNet-5 7
1.2.3 傳統機器學習方法 9
1.2.4 ImageNet和ILSVRC 10
1.2.5 AlexNet 10
1.3 TensorFlow Playground 13
1.4 Quick,Draw! 14
1.5 小結 15
第 2章 人機語言 16
2.1 自然語言處理的深度學習 16
2.1.1 深度學習網路能夠自動學習表征 16
2.1.2 自然語言處理 17
2.1.3 自然語言處理的深度學習簡史 18
2.2 語言的計算表示 19
2.2.1 獨熱編碼 19
2.2.2 詞向量 20
2.2.3 詞向量算法 22
2.2.4 word2viz 23
2.2.5 局部化與分散式表示 24
2.3 自然人類語言要素 25
2.4 Google Duplex 27
2.5 小結 28
第3章 機器藝術 29
3.1 一個熱鬧的通宵 29
目錄 2
3.2 偽人臉算法 31
3.3 風格遷移:照片與莫奈風格間的相互轉換 33
3.4 讓你的素描更具真實感 34
3.5 基於文本創建真實感圖像 35
3.6 使用深度學習進行圖像處理 35
3.7 小結 36
第4章 對弈機 38
4.1 人工智慧、深度學習和其他技術 38
4.1.1 人工智慧 39
4.1.2 機器學習 39
4.1.3 表征學習 39
4.1.4 人工神經網路 39
4.1.5 深度學習 40
4.1.6 機器視覺 40
4.1.7 自然語言處理 41
4.2 機器學習問題的3種類型 41
4.2.1 監督學習 41
4.2.2 無監督學習 41
4.2.3 強化學習 42
4.3 深度強化學習 43
4.4 電子遊戲 44
4.5 棋盤遊戲 45
4.5.1 AlphaGo 46
4.5.2 AlphaGo Zero 49
4.5.3 AlphaZero 50
4.6 目標操縱 52
4.7 主流的深度強化學習環境 53
4.7.1 OpenAI Gym 53
4.7.2 DeepMind Lab 54
4.7.3 Unity ML-Agents 55
4.8 人工智慧的3種類型 56
4.8.1 狹義人工智慧 56
4.8.2 通用人工智慧 56
4.8.3 超級人工智慧 56
4.9 小結 56
目錄 3
第Ⅱ部分 圖解深度學習基本理論 57
第5章 先代碼後理論 58
5.1 預備知識 58
5.2 安裝 58
5.3 用Keras構建淺層網路 59
5.3.1 MNIST手寫數字 59
5.3.2 淺層網路簡圖 60
5.3.3 載入數據 61
5.3.4 重新格式化數據 63
5.3.5 設計神經網路架構 64
5.3.6 訓練深度學習模型 65
5.4 小結 66
第6章 熱狗人工神經元檢測器 67
6.1 生物神經元概述 67
6.2 感知機 68
6.2.1 熱狗/非熱狗感知機 68
6.2.2 本書中重要的公式 71
6.3 現代人工神經元與激活函式 72
6.3.1 sigmoid神經元 72
6.3.2 tanh神經元 73
6.3.3 ReLU:線性整流單元 74
6.4 選擇神經元 74
6.5 小結 75
6.6 核心概念 75
第7章 人工神經網路 76
7.1 輸入層 76
7.2 全連線層 76
7.3 熱狗檢測全連線網路 77
7.3.1 通過第 一個隱藏層的正向傳播 78
7.3.2 通過後續層的正向傳播 79
7.4 快餐分類網路的softmax層 81
目錄 4
7.5 淺層網路回顧 83
7.6 小結 84
7.7 核心概念 84
第8章 訓練深度網路 85
8.1 損失函式 85
8.1.1 平方損失函式 85
8.1.2 飽和神經元 86
8.1.3 交叉熵損失函式 86
8.2 最佳化:學習小化損失 88
8.2.1 梯度下降 88
8.2.2 學習率 89
8.2.3 batch size和隨機梯度下降 90
8.2.4 解決局部極小值問題 92
8.3 反向傳播 94
8.4 調整隱藏層層數和神經元數量 94
8.5 用Keras構建中等深度的神經網路 95
8.6 小結 98
8.7 核心概念 98
第9章 改進深度網路 99
9.1 權重初始化 99
9.2 不穩定梯度 104
9.2.1 梯度消失 104
9.2.2 梯度爆炸 105
9.2.3 批量歸一化 105
9.3 模型泛化(避免過擬合) 106
9.3.1 L1/L2正則化 107
9.3.2 dropout 108
9.3.3 數據增強 110
9.4 理想的最佳化器 110
9.4.1 動量 110
9.4.2 Nesterov動量 111
9.4.3 AdaGrad 111
9.4.4 AdaDelta和RMSProp 111
目錄 5
9.4.5 Adam 112
9.5 用Keras構建深度神經網路 112
9.6 回歸 114
9.7 TensorBoard 116
9.8 小結 118
9.9 核心概念 118
第Ⅲ部分 深度學習的互動套用 119
第 10章 機器視覺 120
10.1 卷積神經網路 120
10.1.1 視覺圖像的二維結構 120
10.1.2 計算複雜度 120
10.1.3 卷積層 121
10.1.4 多個卷積核 122
10.1.5 卷積示例 123
10.1.6 卷積核的超參數 126
10.2 池化層 127
10.3 用Keras實現LeNet-5 129
10.4 用Keras實現AlexNet和VGGNet 133
10.5 殘差網路 136
10.5.1 梯度消失:深度CNN的缺點 136
10.5.2 殘差連線 136
10.5.3 ResNet 138
10.6 機器視覺的套用 139
10.6.1 目標檢測 139
10.6.2 圖像分割 142
10.6.3 遷移學習 143
10.6.4 膠囊網路 147
10.7 小結 147
10.8 核心概念 147
第 11章 自然語言處理 149
11.1 自然語言數據的預處理 149
11.1.1 分詞 151
目錄 6
11.1.2 將所有字元轉換成小寫 153
11.1.3 刪除停頓詞和標點符號 153
11.1.4 詞幹提取 154
11.1.5 處理n-grams 155
11.1.6 預處理整個語料庫 156
11.2 通過word2vec創建詞嵌入 158
11.2.1 word2vec背後的基本理論 158
11.2.2 詞向量的評估 160
11.2.3 word2vec的運行 160
11.2.4 詞向量的繪製 163
11.3 ROC曲線下的面積 167
11.3.1 混淆矩陣 168
11.3.2 計算ROC AUC指標 169
11.4 通過常見網路實現自然語言分類 171
11.4.1 載入IMDb電影評論 171
11.4.2 檢查IMDb數據 173
11.4.3 標準化評論長度 176
11.4.4 全連線網路 176
11.4.5 卷積網路 182
11.5 序列數據的網路設計 186
11.5.1 循環神經網路 186
11.5.2 LSTM 189
11.5.3 雙向LSTM 192
11.5.4 堆疊的循環神經網路 192
11.5.5 seq2seq模型和注意力機制 193
11.5.6 自然語言處理中的遷移學習 194
11.6 非序列架構——Keras函式式API 195
11.7 小結 198
11.8 核心概念 199
第 12章 生成對抗網路 200
12.1 生成對抗網路的基本理論 200
12.2 “Quick,Draw!”數據集 202
12.3 判別器網路 205
12.4 生成器網路 208
目錄 7
12.5 對抗網路 211
12.6 訓練生成對抗網路 212
12.7 小結 218
12.8 核心概念 219
第 13章 深度強化學習 220
13.1 強化學習的基本理論 220
13.1.1 Cart-Pole 遊戲 221
13.1.2 馬爾可夫決策過程 222
13.1.3 策略 224
13.2 深度Q-Learning網路的基本理論 225
13.2.1 值函式 226
13.2.2 Q值函式 226
13.2.3 估計Q值 226
13.3 定義DQN智慧型體 227
13.3.1 初始化參數 229
13.3.2 構建智慧型體的神經網路模型 231
13.3.3 記憶遊戲 232
13.3.4 記憶回放訓練 232
13.3.5 選擇要採取的行動 233
13.3.6 保存和載入模型參數 234
13.4 與OpenAI Gym環境互動 234
13.5 通過SLM Lab進行超參數最佳化 236
13.6 DQN智慧型體以外的智慧型體 238
13.6.1 策略梯度算法和REINFORCE
算法 239
13.6.2 Actor-Critic算法 240
13.7 小結 240
13.8 核心概念 241
第Ⅳ部分 您與人工智慧 243
第 14章 推進專屬於您的深度學習項目 244
14.1 深度學習項目構想 244
14.1.1 機器視覺和生成對抗網路 244
目錄 8
14.1.2 自然語言處理 246
14.1.3 深度強化學習 246
14.1.4 轉換現有的機器學習項目 247
14.2 引申項目資源 248
14.3 建模過程和超參數調優 249
14.4 深度學習框架 251
14.4.1 Keras和TensorFlow 251
14.4.2 PyTorch 253
14.4.3 MXNet、CNTK、Caffe等深度學習
框架 253
14.5 Software 2.0 253
14.6 邁向通用人工智慧 255
14.7 小結 256
第Ⅴ部分 附錄 259
附錄A 神經網路的形式符號 260
附錄B 反向傳播 262
附錄C PyTorch 265
本書圖片來源 271
作者簡介
喬恩·克羅恩(Jon Krohn)是untapt機器學習公司的首席數據科學家,擁有牛津大學的神經科學博士學位,並在紐約數據科學學院和哥倫比亞大學講授深度學習課程。他主持的TensorFlow深度學習視頻課程廣受讚譽。 格蘭特·貝勒費爾德(Grant Beyleveld)是untapt的數據科學家,擁有伊坎醫學院的生物醫學博士學位,主要負責利用深度學習處理自然語言。 阿格萊·巴森斯(Aglaé Bassens)曾在牛津大學和倫敦大學的美術學院研修藝術,她是插畫師、畫家和壁畫家。 譯者簡介 劉樂平,博士畢業於中國人民大學統計學院。天津財經大學大數據統計中心主任,統計學、金融學教授,博士生導師。主要研究領域為貝葉斯數據分析、風險管理與精算。 劉芳,碩士畢業於英國伯明罕大學,天津財經大學珠江學院講師,主要研究方向為金融科技、機器學習和保險精算。 程瑞華,博士畢業於美國新澤西理工學院,天津財經大學金融學院講師,主要研究方向包括深度學習、保險精算等,曾就職創新研究院擔任算法工程師。