《基於Theano的深度學習:構建未來與當前的人工大腦》是2018年4月機械工業出版社出版的圖書,作者是(法)克里斯托弗·布雷斯。
基本介紹
- 中文名:基於Theano的深度學習:構建未來與當前的人工大腦
- 作者:(法)克里斯托弗·布雷斯
- ISBN:9787111588788
- 定價:69元
- 出版社:機械工業出版社
- 出版時間:2018年4月
- 裝幀:平裝
- 開本:16開
內容簡介,作者簡介,圖書目錄,
內容簡介
本書主要介紹了深度學習的基本概念和常用網路以及Theano在深度學習中的套用。全書共13章,首先介紹了Theano的基礎知識,包括張量、計算圖、符號計算、張量運算元、自動微分等概念,然後分別介紹了基於前饋神經網路的手寫體數字分類、單詞的向量編碼、基於遞歸神經網路的文本生成、基於雙向LSTM的情感分析、基於空間變換網路的定位、基於剩餘網路的圖像分類、基於編碼—解碼網路的翻譯與解釋、基於注意力機制的相關輸入或記憶選擇、基於先進遞歸神經網路的時間序列預測、強化環境學習和基於非監督式網路的特徵學習等內容,後介紹了Theano在深度學習中的擴展可能性。
作者簡介
連曉峰 已發表學術論文40餘篇,其中被EI收錄20餘篇;主持國家級項目子課題兩項,省部級項目三項,校級項目兩項,參與完成國家級項目四項,省部級項目六項;出版教材兩部,專著兩部,譯著四十部;獲得國家發明專利兩項,實用新型專利一項;現為中國電子學會高級會員,系統仿真學會會員,北京高新技術企業認定委員會專家庫專家,《機器人技術與套用》雜誌社理事,國家工信部工業和信息化科技人才專家庫專家。
圖書目錄
譯者序
原書前言
本書作者
原書致謝
第1 章 Theano 基礎 //1
1.1 張量所需 //1
1.2 安裝和載入Theano //2
1.2.1 Conda 軟體包和環境管理器 // 2
1.2.2 在CPU 上安裝和運行Theano // 2
1.2.3 GPU 驅動和相關庫 // 3
1.2.4 在GPU 上安裝和運行Theano // 4
1.3 張量 //5
1.4 計算圖和符號計算 //8
1.5 張量操作 //11
1.5.1 維度操作運算元 // 13
1.5.2 元素操作運算元 // 14
1.5.3 約簡操作運算元 // 16
1.5.4 線性代數運算元 // 16
1.6 記憶體和變數 //18
1.7 函式和自動微分 //20
1.8 符號計算中的循環運算 //22
1.9 配置、分析和調試 //26
1.10 小結 //29
第2 章 基於前饋神經網路的手寫體數
字分類 //30
2.1 MNIST 數據集 // 30
2.2 訓練程式架構 // 32
2.3 分類損失函式 // 33
2.4 單層線性模型 // 34
2.5 成本函式和誤差 // 35
2.6 反向傳播算法和隨機梯度下降 // 36
2.7 多層模型 // 37
2.8 卷積層和最大池化層 // 43
2.9 訓練 // 47
2.10 退出 // 52
2.11 推理 // 52
2.12 最佳化和其他更新規則 // 52
2.13 延伸閱讀 // 56
2.14 小結 // 57
第3 章 單詞的向量編碼 //58
3.1 編碼和嵌入 // 58
3.2 數據集 // 60
3.3 連續詞袋模型 // 62
3.4 模型訓練 // 66
3.5 可視化學習嵌入 // 68
3.6 嵌入評價—類比推理 // 70
3.7 嵌入評價—量化分析 // 72
3.8 單詞嵌入套用 // 72
3.9 權重綁定 // 73
基於Theano 的深度學習:
構建未來與當前的人工大腦
XIV
3.10 延伸閱讀 // 73
3.11 小結 // 74
第4 章 基於遞歸神經網路的文本
生成 //75
4.1 RNN 所需 // 75
4.2 自然語言數據集 // 76
4.3 簡單遞歸網路 // 79
4.3.1 LSTM 網路 // 81
4.3.2 門控遞歸網路 // 83
4.4 自然語言性能評測 // 84
4.5 訓練損失比較 // 84
4.6 預測示例 // 86
4.7 RNN 的套用 // 87
4.8 延伸閱讀 // 88
4.9 小結 // 89
第5 章 基於雙向LSTM 的情感
分析 // 90
5.1 Keras 的安裝和配置 // 90
5.1.1 Keras 編程 // 91
5.1.2 SemEval 2013 數據集 // 93
5.2 文本數據預處理 // 94
5.3 模型架構設計 // 96
5.3.1 單詞的向量表征 // 96
5.3.2 基於雙向LSTM 的語句表征 // 97
5.3.3 softmax 分類器的輸出機率 // 98
5.4 模型編譯與訓練 // 99
5.5 模型評估 // 99
5.6 模型保存與載入 // 100
5.7 示例運行 // 100
5.8 延伸閱讀 // 100
5.9 小結 // 101
第6 章 基於空間變換網路的
定位 // 102
6.1 基於Lasagne 的MNIST CNN 模型
// 102
6.2 定位網路 // 104
6.2.1 RNN 在圖像中的套用 // 108
6.3 基於共定位的非監督式學習 // 112
6.4 基於區域的定位網路 // 112
6.5 延伸閱讀 // 113
6.6 小結 // 114
第7 章 基於殘差網路的圖像
分類 // 115
7.1 自然圖像數據集 // 115
7.1.1 批處理標準化 // 116
7.1.2 全局平均池化 // 117
7.2 殘差連線 // 118
7.3 隨機深度 // 123
7.4 密集連線 // 124
7.5 多GPU // 125
7.6 數據增強 // 126
7.7 延伸閱讀 // 127
7.8 小結 // 127
第8 章 基於編碼—解碼網路的翻譯
與解釋 // 128
8.1 序列—序列網路在自然語言處理
中的套用 // 128
8.2 序列—序列網路在語言翻譯中的
套用 // 133
8.3 序列—序列網路在聊天機器人中的
套用 // 134
8.4 序列—序列網路的效率提高 // 134
8.5 圖像反卷積 // 136
目 錄
XV
8.6 多模態深度學習 // 140
8.7 延伸閱讀 // 140
8.8 小結 // 142
第9 章 基於注意力機制的相關輸入
或記憶選擇 // 143
9.1 注意力可微機制 // 143
9.1.1 基於注意力機制的最佳
翻譯 // 144
9.1.2 基於注意力機制的最佳圖像
注釋 // 145
9.2 神經圖靈機中的信息存儲和
檢索 // 146
9.3 記憶網路 // 148
9.3.1 基於動態記憶網路的情景
記憶 // 149
9.4 延伸閱讀 // 150
9.5 小結 // 151
第10 章 基於先進遞歸神經網路的時
間序列預測 // 152
10.1 RNN 的退出 // 152
10.2 RNN 的深度學習方法 // 153
10.3 層疊遞歸網路 // 154
10.4 深度轉移遞歸網路 // 157
10.5 高速網路設計原理 // 157
10.6 遞歸高速網路 // 158
10.7 延伸閱讀 // 159
10.8 小結 // 159
第11 章 強化環境學習 // 160
11.1 強化學習任務 // 160
11.2 仿真環境 // 161
11.3 Q 學習 // 164
11.4 深度Q 學習網路 // 166
11.5 訓練穩定性 // 167
11.6 基於REINFORCE 算法的策略
梯度 // 169
11.7 延伸閱讀 // 171
11.8 小結 // 172
第12 章 基於非監督式網路的特徵
學習 // 173
12.1 生成模型 // 173
12.1.1 受限玻耳茲曼機 // 173
12.1.2 深度信念網路 // 177
12.1.3 生成性對抗網路 // 178
12.1.4 改進GAN // 182
12.2 半監督式學習 // 182
12.3 延伸閱讀 // 183
12.4 小結 // 184
第13 章 基於Theano 的深度學習
擴展 // 185
13.1 CPU 中Python 實現的Theano
操作 // 185
13.2 GPU 中Python 實現的Theano
操作 // 188
13.3 CPU 中C 實現的Theano 操作 //
190
13.4 GPU 中C 實現的Theano 操作 //
193
13.5 通過共享記憶體的合併轉置,NVIDIA
並行 // 196
13.5.1 模型轉換 // 197
13.6 人工智慧的未來發展 // 199
13.7 延伸閱讀 // 201
13.8 小結 // 202