深度學習入門

《深度學習入門》是2020年機械工業出版社出版的圖書。

基本介紹

  • 中文名:深度學習入門
  • 作者:(日)瀧雅人 
  • 出版時間:2020年
  • 出版社:機械工業出版社
  • ISBN:9787111655312
內容簡介,圖書目錄,

內容簡介

深度學習是機器學習研究中的一個活躍領域,《深度學習入門》的宗旨在於為深度 機器學習的初學者提供一本通俗易懂、內容全面、理論深入的學習教材。 本書的內容大體可以分為機器學習基礎、順序傳播神經網路的深度學 習、玻爾茲曼機和深度強化學習四個部分,既考慮了通俗性和完整性,又 介紹了深度學習的各個方面。其中機器學習基礎部分介紹了神經網路、機 器學習與深度學習的數學基礎、典型任務、數據集等;順序傳播神經網路 的深度學習部分介紹了梯度下降法的機器學習、深度學習的正則化、誤差 反向傳播法、自編碼器、卷積神經網路以及循環神經網路等;玻爾茲曼機 部分對圖模型神經網路的機器學習進行了深入的介紹;深度強化學習部分 則重點介紹了強化學習中的深度神經網路學習的理論和方法。 通過本書的學習,讀者可以快速了解機器學習的全貌,同時在理論上 對其模型和方法進行深入分析和理解,從而為實際的開發打下深厚的理論 基礎,為技術創新提供具有啟發性的方向和路徑。

圖書目錄

譯者序
原書序
原書前言
第1章 緒論 1
第2章 機器學習與深度學習 3
2.1 為什麼要進行深度學習 3
2.2 什麼是機器學習 4
2.2.1 典型任務 4
2.2.2 形式各異的數據集 5
2.3 統計學基礎 6
2.3.1 樣本和估計 7
2.3.2 點估計 8
2.3.3 極大似然估計 11
2.4 機器學習基礎 12
2.5 特徵學習與深度學習的進展 23
2.5.1 特徵學習 23
2.5.2 深度學習的出現 24
第3章 神經網路 26
3.1 神經細胞網路 26
3.2 形式神經元 27
3.3 感知器 29
3.3.1 由形式神經元到感知器 29
3.3.2 感知器與馬文·明斯基 (Marvin Lee Minsky) 30
3.4 順序傳播神經網路的組成 31
3.5 神經網路的機器學習 35
3.5.1 回歸 35
3.5.2 二元分類 36
3.5.3 多元分類 37
3.6 激活函式 37
3.6.1 sigmoid函式及其變體 38
3.6.2 正則化線性函式 38
3.6.3 maxout 39
3.7 為什麼深度學習是重要的 40
第4章 基於梯度下降法的機器學習
41 4.1 梯度下降法 41
4.2 改進的梯度下降法 46
4.2.1 梯度下降法的問題 46
4.3 權重參數初始值的選取方法 53
4.4 訓練預處理 55
4.4.1 數據的規格化 55
4.4.2 數據的白化 55
4.4.3 圖像數據的局部對比度
第5章 深度學習的正則化 59
5.1 泛化性能與正則化 59
5.1.1 泛化誤差與過度學習 59
5.1.2 正則化 61
5.2 權重衰減 62
5.3 早期終止 63
5.4 權重共享 65
5.5 數據擴增與噪聲注入 65
5.6 bagging算法 66
5.7 dropout 67
5.8 深度表示的稀疏化 72
5.9 批量規格化 72
5.9.1 內部協變數移位 72
5.9.2 批量規格化 73
第6章 誤差反向傳播法 74
6.1 Perceptron(感知器)和delta 學習規則 74
6.2 誤差反向傳播法 76
6.3 誤差反向傳播法的梯度快速 計算 82
6.4 梯度消失與參數爆炸及其 對策 84
6.4.1 預學習 85
6.4.2 ReLU函式 85
第7章 自編碼器 87
7.1 數據壓縮與主成分分析 87
7.2 自編碼器基礎及套用 90
7.3 稀疏自編碼器 93
7.4 堆疊式自編碼器及預學習 97
7.5 降噪自編碼器 98
7.6 壓縮式自編碼器 99
7.6.1 壓縮式自編碼器流形學習 99
7.6.2 與其他自編碼器的關係 100
第8章 卷積神經網路 101
8.1 一次視覺功能和卷積 101
8.1.1 黑貝爾和威傑爾的層假說 101
8.1.2 神經網路與卷積
8.2 卷積神經網路 104
8.3 CNN的誤差反向傳播法 112
8.4 完成學習的模型和遷移學習 114
8.5 CNN會捕捉到哪些模式 114
8.6 反卷積網路 * 115
8.7 Inception組件 * 116
第9章 循環神經網路 117
9.1 時間序列數據 117
9.2 循環神經網路 118
9.3 機器翻譯的套用 123
9.4 RNN的問題 123
9.5 長短時記憶 124
9.6 循環神經網路與自然語言的 處理 * 130
第10章 玻爾茲曼機 133
10.1 圖模型與機率推論 133
10.1.1 有向圖模型 * 133
10.1.2 無向圖模型 * 136
10.2 有/無隱性變數的玻爾 茲曼機 139
10.3 玻爾茲曼機的學習及計算量的 爆發 142
10.4 吉布斯採樣和玻爾茲曼機 150
10.5 平均場近似 159
10.6 受限玻爾茲曼機 162
10.7 對比散度法及其理論 167
10.8 深度信念網路 175
10.9 深度玻爾茲曼機 181
第11章 深度強化學習 188
11.1 強化學習 188
11.2 近似函式與深度Q網路 197
11.2.1 Q學習與近似函式 197
11.2.2 深度Q學習 199
11.3 雅達利遊戲和DQN 201
11.4 策略學習 203
11.4.1 基於梯度上升法的策略學習
11.4.2 策略梯度定理的證明
11.5 AlphaGo 205
附錄 210 附錄A 機率基礎 210
A.1 隨機變數和機率分布 210
A.2 連續隨機變數和機率密度函式 212
A.3 期望值與方差 214
A.4 信息量與散度 215
附錄B 變分法 217
B.1 泛函式 217
B.2 歐拉·拉格朗日方程式217
參考文獻 219

相關詞條

熱門詞條

聯絡我們