深度學習之PyTorch物體檢測實戰

深度學習之PyTorch物體檢測實戰

《深度學習之PyTorch物體檢測實戰》由董洪義編寫,於2020年1月由機械工業出版社出版發行。

基本介紹

  • 書名:深度學習之PyTorch物體檢測實戰 
  • 作者:董洪義
  • 類別:人工智慧
  • 出版社:機械工業出版社
  • 出版時間:2020年1月 
  • 頁數:280 頁
  • 定價:89 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111641742
內容簡介,圖書目錄,作者簡介,

內容簡介

本書從概念、發展、經典實現方法等幾個方面系統地介紹了物體檢測的相關知識,重點介紹了Faster RCNN、SDD和YOLO這三個經典的檢測器,並利用PyTorch框架從代碼角度進行了細緻講解。另外,本書進一步介紹了物體檢測的輕量化網路、細節處理、難點問題及未來的發展趨勢,從實戰角度給出了多種優秀的解決方法,便於讀者更深入地掌握物體檢測技術,從而做到在實際項目中靈活套用。
本書共10章,涵蓋的主要內容有物體檢測與PyTorch框架基礎概念與背景知識;PyTorch基礎知識;基礎卷積網路Backbone;兩階經典檢測器Faster RCNN;單階多層檢測器SSD;單階經典檢測器YOLO;模型加速之輕量化網路;物體檢測細節處理;物體檢測難點問題;物體檢測的未來發展。
本書內容豐富,講解通俗易懂,案例典型,實用性強,特別適合PyTorch框架愛好者和物體檢測相關從業人員閱讀,也適合深度學習和計算機視覺領域的研究人員閱讀。另外,本書還適合作為深度學習培訓機構的教材使用。

圖書目錄

第1篇 物體檢測基礎知識
第1章 淺談物體檢測與PyTorch 2
1.1 深度學習與計算機視覺 2
1.1.1 發展歷史 2
1.1.2 計算機視覺 7
1.2 物體檢測技術 9
1.2.1 發展歷程 10
1.2.2 技術套用領域 11
1.2.3 評價指標 12
1.3 PyTorch簡介 17
1.3.1 誕生與特點 17
1.3.2 各大深度學習框架對比 17
1.3.3 為什麼選擇PyTorch 19
1.3.4 安裝方法 20
1.4 基礎知識準備 22
1.4.1 Linux基礎 22
1.4.2 Python基礎 24
1.4.3 高效開發工具 29
1.5 總結 36
第2章 PyTorch基礎 37
2.1 基本數據:Tensor 37
2.1.1 Tensor數據類型 37
2.1.2 Tensor的創建與維度查看 39
2.1.3 Tensor的組合與分塊 41
2.1.4 Tensor的索引與變形 42
2.1.5 Tensor的排序與取極值 46
2.1.6 Tensor的自動廣播機制與向量化 46
2.1.7 Tensor的記憶體共享 47
2.2 Autograd與計算圖 48
2.2.1 Tensor的自動求導:Autograd 49
2.2.2 計算圖 50
2.2.3 Autograd注意事項 51
2.3 神經網路工具箱torch.nn 52
2.3.1 nn.Module類 52
2.3.2 損失函式 55
2.3.3 最佳化器nn.optim 56
2.4 模型處理 59
2.4.1 網路模型庫:torchvision.models 59
2.4.2 載入預訓練模型 60
2.4.3 模型保存 61
2.5 數據處理 61
2.5.1 主流公開數據集 61
2.5.2 數據載入 63
2.5.3 GPU加速 65
2.5.4 數據可視化 66
2.6 總結 68
第3章 網路骨架:Backbone 69
3.1 神經網路基本組成 69
3.1.1 卷積層 70
3.1.2 激活函式層 72
3.1.3 池化層 75
3.1.4 Dropout層 76
3.1.5 BN層 77
3.1.6 全連線層 79
3.1.7 深入理解感受野 81
3.1.8 詳解空洞卷積(Dilated Convolution) 82
3.2 走向深度:VGGNet 83
3.3 縱橫交錯:Inception 87
3.4 里程碑:ResNet 93
3.5 繼往開來:DenseNet 95
3.6 特徵金字塔:FPN 99
3.7 為檢測而生:DetNet 106
3.8 總結 110
第2篇 物體檢測經典框架
第4章 兩階經典檢測器:Faster RCNN 112
4.1 RCNN系列發展歷程 112
4.1.1 開山之作:RCNN 112
4.1.2 端到端:Fast RCNN 113
4.1.3 走向實時:Faster RCNN 114
4.2 準備工作 114
4.3 Faster RCNN總覽 115
4.4 詳解RPN 117
4.4.1 理解Anchor 117
4.4.2 RPN的真值與預測量 119
4.4.3 RPN卷積網路 120
4.4.4 RPN真值的求取 122
4.4.5 損失函式設計 124
4.4.6 NMS與生成Proposal 125
4.4.7 篩選Proposal得到RoI 126
4.5 RoI Pooling層 127
4.6 全連線RCNN模組 130
4.6.1 RCNN全連線網路 130
4.6.2 損失函式設計 131
4.7 Faster RCNN的改進算法 131
4.7.1 審視Faster RCNN 132
4.7.2 特徵融合:HyperNet 133
4.7.3 實例分割:Mask RCNN 134
4.7.4 全卷積網路:R-FCN 137
4.7.5 級聯網路:Cascade RCNN 139
4.8 總結 141
第5章 單階多層檢測器:SSD 142
5.1 SSD總覽 142
5.1.1 SSD的算法流程 142
5.1.2 代碼準備工作 143
5.2 數據預處理 144
5.2.1 載入PASCAL數據集 144
5.2.2 數據增強 144
5.3 網路架構 148
5.3.1 基礎VGG結構 148
5.3.2 深度卷積層 149
5.3.3 PriorBox與框線特徵提取網路 150
5.3.4 總體網路計算過程 153
5.4 匹配與損失求解 154
5.4.1 預選框與真實框的匹配 154
5.4.2 定位損失的計算 155
5.4.3 難樣本挖掘 156
5.4.4 類別損失計算 156
5.5 SSD的改進算法 157
5.5.1 審視SSD 157
5.5.2 特徵融合:DSSD 158
5.5.3 彩虹網路:RSSD 160
5.5.4 基於SSD的兩階:RefineDet 162
5.5.5 多感受野融合:RFBNet 165
5.6 總結 166
第6章 單階經典檢測器:YOLO 167
6.1 無錨框預測:YOLO v1 167
6.1.1 網路結構 167
6.1.2 特徵圖的意義 168
6.1.3 損失計算 169
6.2 依賴錨框:YOLO v2 171
6.2.1 網路結構的改善 171
6.2.2 先驗框的設計 173
6.2.3 正、負樣本與損失函式 175
6.2.4 正、負樣本選取代碼示例 176
6.2.5 工程技巧 179
6.3 多尺度與特徵融合:YOLO v3 180
6.3.1 新網路結構DarkNet-53 180
6.3.2 多尺度預測 181
6.3.3 Softmax改為Logistic 182
6.4 總結 183
第3篇 物體檢測的難點與發展
第7章 模型加速之輕量化網路 186
7.1 壓縮再擴展:SqueezeNet 188
7.1.1 SqueezeNet網路結構 188
7.1.2 SqueezeNet總結 190
7.2 深度可分離:MobileNet 191
7.2.1 標準卷積 191
7.2.2 深度可分離卷積 192
7.2.3 MobileNet v1結構 193
7.2.4 MobileNet v1總結 198
7.2.5 MobileNet v2 198
7.3 通道混洗:ShuffleNet 200
7.3.1 通道混洗 201
7.3.2 網路結構 202
7.3.3 ShuffleNet v2 205
7.4 總結 207
第8章 物體檢測細節處理 209
8.1 非極大值抑制:NMS 209
8.1.1 NMS基本過程 210
8.1.2 抑制得分:Soft NMS 212
8.1.3 加權平均:Softer NMS 213
8.1.4 定位置信度:IoU-Net 215
8.2 樣本不均衡問題 217
8.2.1 不均衡問題分析 217
8.2.2 線上難樣本挖掘:OHEM 219
8.2.3 專注難樣本:Focal Loss 221
8.3 模型過擬合 224
8.3.1 數據增強 226
8.3.2 L1與L2正則化 227
8.4 總結 229
第9章 物體檢測難點 230
9.1 多尺度檢測 230
9.1.1 多尺度問題 230
9.1.2 降低下採樣率與空洞卷積 232
9.1.3 Anchor設計 233
9.1.4 多尺度訓練 235
9.1.5 特徵融合 235
9.1.6 尺度歸一化:SNIP 236
9.1.7 三叉戟:TridentNet 238
9.2 擁擠與遮擋 239
9.2.1 遮擋背景 240
9.2.2 排斥損失:Repulsion Loss 242
9.2.3 OR-CNN 244
9.3 總結 247
第10章 物體檢測的未來發展 248
10.1 重新思考物體檢測 248
10.1.1 精度與速度的權衡 249
10.1.2 卷積網路的可解釋性與穩定性 249
10.1.3 訓練:微調還是隨機初始化 250
10.1.4 考慮物體間關係的檢測 251
10.1.5 最佳化卷積方式 252
10.1.6 神經架構搜尋:NAS 253
10.1.7 與產業結合的創新 255
10.2 擺脫錨框:Anchor-Free 257
10.2.1 重新思考Anchor 257
10.2.2 基於角點的檢測:CornerNet 258
10.2.3 檢測中心點:CenterNet 262
10.2.4 錨框自學習:Guided Anchoring 264
10.3 總結 266

作者簡介

董洪義 本科、碩士均畢業於北京航空航天大學。深度學習與PyTorch資深愛好者。現任百度自動駕駛高級算法工程師。曾擔任Phantom Tiger算法負責人、地平線智慧型駕駛部門算法實習生、北航國際拓展團團長。曾經被評為北京航空航天大學年度人物。曾經獲得了Kaggle競賽銀牌。本科期間成績年級第一,曾前往日本、英國、比利時、荷蘭等國的知名學校訪問交流。研究方向為自動駕駛感知、智慧型機器人與計算機視覺。有3年以上的深度學習研發經驗。

相關詞條

熱門詞條

聯絡我們