深度學習之模型設計：核心算法與案例實踐

內容簡介

本書理論知識體系完備，由淺入深，系統性地介紹了深度學習模型的發展脈絡，以及模型深度設計、模型寬度設計、模型通道維度設計、殘差連線設計、分組卷積設計、多尺度與非正常卷積設計、多輸入網路設計、時序神經網路設計、三維卷積網路設計、動態推理模型與注意力機制設計、生成對抗網路設計這10類主流的深度學習模型設計思想。同時，本書為各模型設計思想提供了大量的實例，供讀者實戰演練。

作者簡介

本書作者龍鵬，筆名言有三，畢她贈辣業於中國科學院，有超過5年的深度學習領域從業經驗，以及超過6年的計算機視覺從業經驗，創辦了微信公眾號《有三AI》和知識星球《有三AI》等知識生態，目前已經全職做內容輸出，於2019年花費大半年時間總結多年的知識積累和深度學習項目經驗並撰寫了這本書。

圖書目錄

第1章神經網路和計算機視覺基礎 1

1.1 計算機視覺 1

1.1.1 研究視覺的重要性 1

1.1.2 生物學視覺原理與視覺分層理論 2

1.2 數字圖像基礎 3

1.2.1 數字圖像基礎概述 3

1.2.4 數字圖像處理基礎 7

1.3 神經網路基礎 11

1.3.1 生物神經元與人工神經網路 12

1.3.2 感知機是神經網路嗎 12

1.3.3 BP算法 16

第2章深度學習的基礎 20

2.1 全連線神經網路的局限性 20

2.1.1 學習原理的缺陷 20

2.1.2 全連線神經網路的結構缺陷 21

2.1.3 高性能的傳統機器學習算法 22

2.2 深度學習第三次復興簡史 22

2.2.1 網際網路與大數據來了 23

2.2.2 GPU的普及 23

2.2.3 深層神經網路華麗歸來 24

2.2.4 語音識別的重大突破 25

2.2.4 圖像識別的重大突破 26

2.2.5 自充循棗然語言處理的重大突破 28

2.3 卷積神經網路基礎 29

2.3.1 卷積操作 29

2.3.2 反卷積操作 30

2.3.3 卷積神經網路基本概念 31

2.3.4 卷積神經網路的核心思想 33

2.3.5 卷積神經網路的基本結構配置 33

2.4 深度學習最佳化基礎 37

2.4.1 激活模型與常用激活函式 38

2.4.2 參數初始化方法 43

2.4.3 歸一化方法 45

2.4.4 池化 49

2.4.5 最最佳化方舉艱紙法 50

2.4.6 學習率策略 54

2.4.7 正則化方法 57

2.5 深度學習主流開源框架 60

2.5.1 Caffe 60

2.5.2 TensorFlow 61

2.5.3 Pytorch 61

2.5.4 Theano 62

2.5.5 Keras 62

2.5.6 MXNet 63

2.5.7 Chainer 63

參考文獻 64

第3章數據集、評測指標與最佳化目標 66

3.1 數據集 66

3.1.1 分類數據集MNIST 66

3.1.2 ImageNet 66

3.1.3 分類數據集GHIM-10k 67

3.1.4 分類數據集Place20 67

3.1.5 肖像分割數據集 68

3.1.6 視頻分類數據集UCF101 68

3.1.7 目標跟判危蹤數據集ImageNet VIDEO 68

3.2 評測指標 69

3.2.1 分類評兵葛企測指標 69

3.2.2 檢索與回歸船鴉估店評測指標 73

3.2.3 圖像生成評測指標 75

3.3 最佳化目標 76

3.3.1 分類任務損失 76

3.3.2 回歸任務損失 78

參考文獻 80

第4章加深網路，提升模型性能 81

4.1 經典的淺層卷積神經網路 81

4.1.1 Neocognitron網路 81

4.1.2 TDNN 83

4.1.3 Cresceptron網屑己舟享絡 83

4.1.4 LeNet系列 84

4.2 經典網路的深度設計 87

4.2.1 AlexNet 87

4.2.2 從AlexNet到VGGNet的升級 90

4.2.3 為什麼需要更深的網路 93

4.3 實驗：網路深度對分類模型性能的影響 94

4.3.1 基準模型 94

4.3.2 不同學習率策略與最佳化方法 96

4.3.3 標準卷積模型網路深度影響實驗 104

4.3.4 MobileNet網路深度影響實驗 111

4.3.5 總結 113

參考文獻 114

第5章 1×1卷積，通道維度升降的利器 115

5.1 特徵通道與信息融合 115

5.1.1 通道內特徵能做什麼 115

5.1.2 通道間特徵能做什麼 116

5.2 1×1卷積及其套用 117

5.2.1 什麼是1×1卷積 117

5.2.2 1×1卷積與瓶頸結構 117

5.2.3 1×1卷積與SqueezeNet 118

5.3 1×1卷積在瓶頸結構中的作用 120

5.3.1 基準模型 120

5.3.2 瓶頸結構探索 126

5.3.3 訓練結果 143

5.4 1×1卷積在增強網路表達能力中的作用 145

5.4.1 基準模型 145

5.4.2 網路配置 146

5.4.3 實驗結果 146

參考文獻 148

第6章加寬網路，提升模型性能 149

6.1 為什麼需要更寬的網路結構 149

6.2 經典模型的網路寬度設計思想 149

6.2.1 調整通道數量 150

6.2.2 多分支網路結構設計 152

6.2.3 通道補償技術 154

6.3 實驗：網路寬度對模型性能的影響 155

6.3.1 實驗背景 155

6.3.2 訓練結果 161

6.3.3 總結 166

參考文獻 166

第7章殘差連線，深層網路收斂的關鍵 167

7.1 殘差連線 167

7.1.1 什麼是殘差連線 167

7.1.2 為什麼殘差連線有效 169

7.2 殘差網路結構發展和套用 171

7.2.1 密集連線的殘差網路結構 171

7.2.2 多分支殘差結構 173

7.2.3 殘差連線與多尺度信息融合 174

7.3 跳層連線在圖像分割中的套用 175

7.3.1 數據集與基準模型 175

7.3.2 Allconv5_SEG實驗 184

7.3.3 增加跳層連線 186

參考文獻 199

第8章分組卷積與卷積拆分，移動端高效率經典模型 201

8.1 卷積拆分與分組卷積 201

8.1.1 卷積拆分 201

8.1.2 分組卷積 201

8.2 分組卷積結構 202

8.2.1 簡單的通道分組網路 203

8.2.2 級連通道分組網路 204

8.2.3 多解析度卷積核通道分組網路 205

8.2.4 多尺度通道分組網路 206

8.2.5 多精度通道分組網路 207

8.3 訓練一個用於圖像分割的實時分組網路 208

8.3.1 項目背景 208

8.3.2 嘴唇分割模型訓練 208

8.3.3 嘴唇分割模型最佳化 212

參考文獻 219

第9章多尺度網路與非正常卷積，更豐富的感受野與不變性 221

9.1 目標常見變換與不變性 221

9.1.1 常見變換 221

9.1.2 從模型本身獲取不變性 221

9.1.3 從數據中學習不變性 223

9.2 多尺度網路結構 224

9.2.1 圖像金字塔 224

9.2.2 多尺度網路 225

9.3 非正常卷積網路結構 228

9.3.1 帶孔卷積 228

9.3.2 可變形卷積 229

9.3.3 非局部卷積 230

9.4 STN在可變形手寫數字中的套用 232

9.4.1 項目背景 232

9.4.2 STN實驗 233

參考文獻 237

第10章多輸入網路，圖像檢索和排序的基準模型 238

10.1 什麼時候需要多個輸入 238

10.1.1 圖像檢索 238

10.1.2 目標跟蹤 239

10.1.3 相對排序 239

10.2 常見多輸入網路 240

10.2.1 Siamese網路 240

10.2.2 Triplet網路 241

10.3 目標跟蹤Siamese網路實戰 242

10.3.1 網路結構 242

10.3.2 數據讀取 244

10.3.3 損失函式和評估指標 247

10.3.4 模型訓練 248

10.3.5 模型測試 249

參考文獻 254

第11章時序神經網路，有記憶的網路更聰明 255

11.1 單向RNN和雙向RNN 255

11.1.1 RNN 255

11.1.2 雙向RNN 257

11.2 LSTM 258

11.3 LSTM視頻分類實踐 260

11.3.1 數據準備 260

11.3.2 數據讀取 260

11.3.3 網路定義 264

11.3.4 模型訓練結果 269

11.3.5 總結 270

第12章卷積從二維變成三維，實現升維打擊 271

12.1 三維卷積 271

12.2 三維卷積的套用 272

12.2.1 分類任務 272

12.2.2 圖像分割 274

12.3 一個用於視頻分類的三維卷積網路 274

12.3.1 基準模型與數據集 275

12.3.2 數據讀取 278

12.3.3 訓練結果 280

12.3.4 參數調試 281

12.3.5 總結 283

參考文獻 283

第13章動態推理與注意力機制，網路因樣本而異 284

13.1 拓撲結構動態變化的網路 284

13.1.1 訓練時拓撲結構變化的網路 284

13.1.2 測試時拓撲結構變化的網路 285

13.2 注意力機制 288

13.2.1 空間注意力模型 289

13.2.2 通道注意力模型[9] 289

13.2.3 混合注意力模型 290

13.3 基於提前退出機制的BranchyNet分類實戰 291

13.3.1 背景 291

13.3.2 模型定義 292

13.3.3 實驗結果 302

參考文獻 305

第14章生成對抗網路 306

14.1 生成對抗網路的基本原理 306

14.1.1 生成式模型與判別式模型 306

14.1.2 GAN簡介 307

14.2 生成對抗網路損失的發展 308

14.2.1 GAN的損失函式問題 308

14.2.2 GAN的損失函式改進 309

14.3 生成對抗網路結構的發展 310

14.3.1 條件GAN 310

14.3.2 多尺度級連GAN 311

14.3.3 多判別器單生成器GAN 312

14.3.4 多生成器單判別器GAN 313

14.3.5 多生成器多判別器GAN 313

14.4 DCGAN圖像生成實戰 314

14.4.1 項目背景 314

14.4.2 項目解讀 315

14.4.3 實驗結果 319

參考文獻 321

深度學習之模型設計：核心算法與案例實踐

基本介紹

內容簡介

作者簡介

圖書目錄

熱門詞條