《深度學習與目標檢測》是2020年3月電子工業出版社出版的圖書,作者是杜鵬、諶明、蘇統華。
基本介紹
- 書名:深度學習與目標檢測
- 作者:杜鵬、諶明、蘇統華
- ISBN:9787121367854
- 頁數:276
- 定價:¥89.0
- 出版社:電子工業出版社
- 出版時間:2020年3月
- 開本:16開
內容簡介,圖書目錄,
內容簡介
本書的寫作初衷是,從學者的角度,用一種通俗易懂的方式,把與基於深度學習的目標檢測的相關論文中的理論和方法呈現給讀者,同時針對作者在深度學習教學過程中遇到的難點,進行深入的分析和講解。本書側重對卷積神經網路的介紹,而深度學習的內容不止於此。所以,作者將深度學習分為有監督學習、無監督學習和強化學習三類,將圖像分類、目標檢測、語音識別、人臉識別、對抗生成網路和AlphaGo圍棋等套用場景歸入不同的類別,並分別對其原理進行了概括性的講解。本書適合有一定深度學習或目標檢測學習基礎的學生、研究者、從業者閱讀。
圖書目錄
基礎篇
第1章 深度學習概述 2
1.1 深度學習發展簡史 2
1.2 有監督學習 4
1.2.1 圖像分類 4
1.2.2 目標檢測 6
1.2.3 人臉識別 10
1.2.4 語音識別 13
1.3 無監督學習 18
1.3.1 無監督學習概述 18
1.3.2 生成對抗網路 18
1.4 強化學習 21
1.4.1 AlphaGo 21
1.4.2 AlphaGo Zero 23
1.5 小結 25
參考資料 25
第2章 深度神經網路 27
2.1 神經元 27
2.2 感知機 30
2.3 前向傳遞 31
2.3.1 前向傳遞的流程 32
2.3.2 激活函式 33
2.3.3 損失函式 37
2.4 後向傳遞 40
2.4.1 後向傳遞的流程 40
2.4.2 梯度下降 40
2.4.3 參數修正 42
2.5 防止過擬合 44
2.5.1 dropout 44
2.5.2 正則化 45
2.6 小結 46
第3章 卷積神經網路 47
3.1 卷積層 48
3.1.1 valid卷積 48
3.1.2 full卷積 50
3.1.3 same卷積 51
3.2 池化層 52
3.3 反卷積 53
3.4 感受野 54
3.5 卷積神經網路實例 56
3.5.1 LeNet-5 56
3.5.2 AlexNet 58
3.5.3 VGGNet 62
3.5.4 GoogLeNet 64
3.5.5 ResNet 75
3.5.6 MobileNet 76
3.6 小結 78
進階篇
第4章 兩階段目標檢測方法 80
4.1 R-CNN 80
4.1.1 算法流程 80
4.1.2 訓練過程 81
4.2 SPP-Net 85
4.2.1 網路結構 85
4.2.2 空間金字塔池化 86
4.3 Fast R-CNN 87
4.3.1 感興趣區域池化層 87
4.3.2 網路結構 89
4.3.3 全連線層計算加速 90
4.3.4 目標分類 91
4.3.5 邊界框回歸 92
4.3.6 訓練過程 93
4.4 Faster R-CNN 97
4.4.1 網路結構 98
4.4.2 RPN 99
4.4.3 訓練過程 105
4.5 R-FCN 107
4.5.1 R-FCN網路結構 108
4.5.2 位置敏感的分數圖 109
4.5.3 位置敏感的RoI池化 110
4.5.4 R-FCN損失函式 111
4.5.5 Caffe網路模型解析 111
4.5.6 U-Net 115
4.5.7 SegNet 116
4.6 Mask R-CNN 117
4.6.1 實例分割簡介 118
4.6.2 COCO數據集的像素級標註 119
4.6.3 網路結構 120
4.7 小結 123
參考資料 123
第5章 單階段目標檢測方法 125
5.1 SSD 125
5.1.1 default box 125
5.1.2 網路結構 126
5.1.3 Caffe網路模型解析 127
5.1.4 訓練過程 135
5.2 RetinaNet 137
5.2.1 FPN 137
5.2.2 聚焦損失函式 139
5.3 RefineDet140
5.3.1 網路模型 141
5.3.2 Caffe網路模型解析 143
5.3.3 訓練過程 152
5.4 YOLO 153
5.4.1 YOLO v1 153
5.4.2 YOLO v2155
5.4.3 YOLO v3 157
5.5 目標檢測算法套用場景 159
5.5.1 高速公路坑洞檢測 160
5.5.2 息肉檢測 161
5.6 小結 162
參考資料 162
套用篇
第6章 肋骨骨折檢測 166
6.1 國內外研究現狀 166
6.2 解決方案 168
6.3 預處理 168
6.4 肋骨骨折檢測 169
6.5 實驗結果分析 170
6.6 小結 172
參考資料 173
第7章 肺結節檢測 174
7.1 國內外研究現狀 174
7.2 總體框架 176
7.2.1 肺結節數據集 176
7.2.2 肺結節檢測難點 177
7.2.3 算法框架 177
7.3 肺結節可疑位置推薦算法 178
7.3.1 CT圖像的預處理 179
7.3.2 肺結節分割算法 180
7.3.3 最佳化方法 182
7.3.4 推斷方法 184
7.4 可疑肺結節定位算法 185
7.5 實驗結果與分析(1) 186
7.5.1 實驗結果 186
7.5.2 改進點效果分析 186
7.6 假陽性肺結節抑制算法 188
7.6.1 假陽性肺結節抑制網路 188
7.6.2 最佳化策略 192
7.6.3 推斷策略 194
7.7 實驗結果與分析(2) 194
7.7.1 實驗結果 195
7.7.2 改進點效果分析 195
7.7.3 可疑位置推薦與假陽性抑制算法的整合 197
7.8 小結 197
參考資料 197
第8章 車道線檢測 200
8.1 國內外研究現狀 200
8.2 主要研究內容 202
8.2.1 總體解決方案 202
8.2.2 各階段概述 203
8.3 車道線檢測系統的設計與實現 206
8.3.1 車道線圖像數據標註與篩選 206
8.3.2 車道線圖片預處理 208
8.3.3 車道線分割模型訓練 212
8.3.4 車道線檢測 221
8.3.5 車道線檢測結果 225
8.4 車道線檢測系統性能測試 225
8.4.1 車道線檢測質量測試 225
8.4.2 車道線檢測時間測試 227
8.5 小結 227
參考資料 228
第9章 交通視頻分析 229
9.1 國內外研究現狀 230
9.2 主要研究內容 231
9.2.1 總體設計 232
9.2.2 精度和性能要求 232
9.3 交通視頻分析 233
9.3.1 車輛檢測和車牌檢測 233
9.3.2 車牌識別功能設計詳解 235
9.3.3 車輛品牌及顏色的識別 243
9.3.4 目標跟蹤設計詳解 244
9.4 系統測試 247
9.4.1 車輛檢測 248
9.4.2 車牌檢測 251
9.4.3 車牌識別 253
9.4.4 車輛品牌識別 256
9.4.5 目標跟蹤 258
9.5 小結 259
參考資料 260,基礎篇
第1章 深度學習概述 2
1.1 深度學習發展簡史 2
1.2 有監督學習 4
1.2.1 圖像分類 4
1.2.2 目標檢測 6
1.2.3 人臉識別 10
1.2.4 語音識別 13
1.3 無監督學習 18
1.3.1 無監督學習概述 18
1.3.2 生成對抗網路 18
1.4 強化學習 21
1.4.1 AlphaGo 21
1.4.2 AlphaGo Zero 23
1.5 小結 25
參考資料 25
第2章 深度神經網路 27
2.1 神經元 27
2.2 感知機 30
2.3 前向傳遞 31
2.3.1 前向傳遞的流程 32
2.3.2 激活函式 33
2.3.3 損失函式 37
2.4 後向傳遞 40
2.4.1 後向傳遞的流程 40
2.4.2 梯度下降 40
2.4.3 參數修正 42
2.5 防止過擬合 44
2.5.1 dropout 44
2.5.2 正則化 45
2.6 小結 46
第3章 卷積神經網路 47
3.1 卷積層 48
3.1.1 valid卷積 48
3.1.2 full卷積 50
3.1.3 same卷積 51
3.2 池化層 52
3.3 反卷積 53
3.4 感受野 54
3.5 卷積神經網路實例 56
3.5.1 LeNet-5 56
3.5.2 AlexNet 58
3.5.3 VGGNet 62
3.5.4 GoogLeNet 64
3.5.5 ResNet 75
3.5.6 MobileNet 76
3.6 小結 78
進階篇
第4章 兩階段目標檢測方法 80
4.1 R-CNN 80
4.1.1 算法流程 80
4.1.2 訓練過程 81
4.2 SPP-Net 85
4.2.1 網路結構 85
4.2.2 空間金字塔池化 86
4.3 Fast R-CNN 87
4.3.1 感興趣區域池化層 87
4.3.2 網路結構 89
4.3.3 全連線層計算加速 90
4.3.4 目標分類 91
4.3.5 邊界框回歸 92
4.3.6 訓練過程 93
4.4 Faster R-CNN 97
4.4.1 網路結構 98
4.4.2 RPN 99
4.4.3 訓練過程 105
4.5 R-FCN 107
4.5.1 R-FCN網路結構 108
4.5.2 位置敏感的分數圖 109
4.5.3 位置敏感的RoI池化 110
4.5.4 R-FCN損失函式 111
4.5.5 Caffe網路模型解析 111
4.5.6 U-Net 115
4.5.7 SegNet 116
4.6 Mask R-CNN 117
4.6.1 實例分割簡介 118
4.6.2 COCO數據集的像素級標註 119
4.6.3 網路結構 120
4.7 小結 123
參考資料 123
第5章 單階段目標檢測方法 125
5.1 SSD 125
5.1.1 default box 125
5.1.2 網路結構 126
5.1.3 Caffe網路模型解析 127
5.1.4 訓練過程 135
5.2 RetinaNet 137
5.2.1 FPN 137
5.2.2 聚焦損失函式 139
5.3 RefineDet140
5.3.1 網路模型 141
5.3.2 Caffe網路模型解析 143
5.3.3 訓練過程 152
5.4 YOLO 153
5.4.1 YOLO v1 153
5.4.2 YOLO v2155
5.4.3 YOLO v3 157
5.5 目標檢測算法套用場景 159
5.5.1 高速公路坑洞檢測 160
5.5.2 息肉檢測 161
5.6 小結 162
參考資料 162
套用篇
第6章 肋骨骨折檢測 166
6.1 國內外研究現狀 166
6.2 解決方案 168
6.3 預處理 168
6.4 肋骨骨折檢測 169
6.5 實驗結果分析 170
6.6 小結 172
參考資料 173
第7章 肺結節檢測 174
7.1 國內外研究現狀 174
7.2 總體框架 176
7.2.1 肺結節數據集 176
7.2.2 肺結節檢測難點 177
7.2.3 算法框架 177
7.3 肺結節可疑位置推薦算法 178
7.3.1 CT圖像的預處理 179
7.3.2 肺結節分割算法 180
7.3.3 最佳化方法 182
7.3.4 推斷方法 184
7.4 可疑肺結節定位算法 185
7.5 實驗結果與分析(1) 186
7.5.1 實驗結果 186
7.5.2 改進點效果分析 186
7.6 假陽性肺結節抑制算法 188
7.6.1 假陽性肺結節抑制網路 188
7.6.2 最佳化策略 192
7.6.3 推斷策略 194
7.7 實驗結果與分析(2) 194
7.7.1 實驗結果 195
7.7.2 改進點效果分析 195
7.7.3 可疑位置推薦與假陽性抑制算法的整合 197
7.8 小結 197
參考資料 197
第8章 車道線檢測 200
8.1 國內外研究現狀 200
8.2 主要研究內容 202
8.2.1 總體解決方案 202
8.2.2 各階段概述 203
8.3 車道線檢測系統的設計與實現 206
8.3.1 車道線圖像數據標註與篩選 206
8.3.2 車道線圖片預處理 208
8.3.3 車道線分割模型訓練 212
8.3.4 車道線檢測 221
8.3.5 車道線檢測結果 225
8.4 車道線檢測系統性能測試 225
8.4.1 車道線檢測質量測試 225
8.4.2 車道線檢測時間測試 227
8.5 小結 227
參考資料 228
第9章 交通視頻分析 229
9.1 國內外研究現狀 230
9.2 主要研究內容 231
9.2.1 總體設計 232
9.2.2 精度和性能要求 232
9.3 交通視頻分析 233
9.3.1 車輛檢測和車牌檢測 233
9.3.2 車牌識別功能設計詳解 235
9.3.3 車輛品牌及顏色的識別 243
9.3.4 目標跟蹤設計詳解 244
9.4 系統測試 247
9.4.1 車輛檢測 248
9.4.2 車牌檢測 251
9.4.3 車牌識別 253
9.4.4 車輛品牌識別 256
9.4.5 目標跟蹤 258
9.5 小結 259
參考資料 260"