內容簡介
《自動駕駛:感知原理與實踐》主要涉及的內容包括神經網路的基礎理論知識、經典
卷積神經網路、輕量化卷積神經網路、Vision Transformer等相關技術,為了讓讀者全面、深入、透徹地理解所講解的算法,書中還給出了具體的實踐案例,並提供了相應的數據集供讀者實踐,同時通過對代碼的講解使讀者獲得實戰能力。
圖書目錄
第1 章計算機視覺與神經網路............................................................................ 1
1.1 人工神經網路......................................................................................................1
1.1.1 感知機 .....................................................................................................2
1.1.2 神經網路.................................................................................................2
1.2 卷積神經網路 ......................................................................................................4
1.2.1 卷積.........................................................................................................4
1.2.2 激活函式 .................................................................................................5
1.2.3 池化層.....................................................................................................6
1.2.4 全連線層.................................................................................................6
1.3 經典卷積神經網路..............................................................................................7
1.3.1 AlexNet....................................................................................................7
1.3.2 VGG ........................................................................................................8
1.3.3 GoogLeNet..............................................................................................9
1.3.4 ResNet ...................................................................................................11
1.3.5 DarkNet.................................................................................................14
1.3.6 CSPDarkNet..........................................................................................16
1.4 輕量化卷積神經網路........................................................................................18
1.4.1 MobileNet..............................................................................................18
1.4.2 ShuffleNet..............................................................................................22
1.4.3 GhostNet................................................................................................25
1.5 Vision Transformer 在計算機視覺中的套用 .................................................... 27
1.5.1 ViT.........................................................................................................27
1.5.2 Swin Transformer..................................................................................30
1.5.3 MobileViT.............................................................................................34
1.5.4 TRT-ViT.................................................................................................36
1.5.5 基於ResNet/MobileViT 的交通標識牌識別項目實踐....................... 38
1.6 本章小結............................................................................................................55
第2 章目標檢測在自動駕駛中的套用 ...............................................................56
2.1 目標檢測簡介....................................................................................................56
2.1.1 相關工作簡介 .......................................................................................56
2.1.2 兩階段目標檢測算法簡介 ...................................................................57
2.1.3 單階段目標檢測算法簡介 ...................................................................62
2.2 自動駕駛中的車輛檢測 ....................................................................................66
2.2.1 BDD100K 數據集簡介......................................................................... 66
2.2.2 YOLOv5 算法的原理........................................................................... 67
2.2.3 基於YOLOv5 的車輛檢測項目實踐.................................................. 74
2.3 自動駕駛中的行人檢測....................................................................................81
2.3.1 YOLOX 算法的原理 ............................................................................81
2.3.2 基於YOLOX 的行人檢測項目實踐 ...................................................90
2.4 自動駕駛中的交通標識牌檢測...................................................................... 104
2.4.1 NanoDet 算法的原理 ..........................................................................104
2.4.2 基於NanoDet 的交通標識牌檢測項目實踐..................................... 110
2.5 自動駕駛中的交通信號燈的檢測與識別 ...................................................... 125
2.5.1 YOLOv5-Lite 算法的原理 .................................................................125
2.5.2 基於YOLOv5-Lite 的交通信號燈檢測項目實踐............................. 128
2.6 3D 目標檢測....................................................................................................131
2.6.1 PointPillars...........................................................................................132
2.6.2 BEVFormer.........................................................................................136
2.6.3 基於OpenPCDet 的3D 目標檢測項目實踐 ..................................... 139
2.7 本章小結 ..........................................................................................................153
第3 章語義分割在自動駕駛中的套用............................................................. 154
3.1 STDC 算法的原理...........................................................................................155
3.1.1 STDC 模組..........................................................................................155
3.1.2 STDC 語義分割網路.......................................................................... 157
3.2 TopFormer 算法的原理 ...................................................................................160
3.2.1 Token Pyramid Module....................................................................... 161
3.2.2 Scale-Aware Semantics Extractor........................................................ 162
3.2.3 Semantics Injection Module................................................................ 162
3.2.4 Segmentation Head..............................................................................163
3.3 基於TopFormer 的可行駛區域分割項目實踐...............................................163
3.3.1 Cityscapes 數據集簡介....................................................................... 163
3.3.2 TopFormer 模型實現.......................................................................... 164
3.4 本章小結 ..........................................................................................................172
第4 章車道線檢測與分割...............................................................................173
4.1 UNet 算法的原理.............................................................................................174
4.2 LaneATT 算法的原理......................................................................................176
4.2.1 Lane 的Anchor 表征.......................................................................... 177
4.2.2 基於Anchor 的特徵圖池化............................................................... 177
4.2.3 局部注意力機制.................................................................................178
4.2.4 Proposal 預測 ......................................................................................179
4.2.5 後處理.................................................................................................179
4.3 基於LaneATT 的車道線檢測實踐................................................................. 180
4.3.1 CULane 數據集介紹........................................................................... 180
4.3.2 LaneATT 實踐 .....................................................................................180
4.4 本章小結..........................................................................................................186
第5 章多目標跟蹤在自動駕駛中的套用.......................................................... 187
5.1 多目標跟蹤算法SORT 的原理...................................................................... 187
5.2 多目標跟蹤算法DeepSORT 的原理.............................................................. 192
5.2.1 級聯匹配.............................................................................................192
5.2.2 ReID 特徵提取....................................................................................193
5.3 多目標跟蹤算法ByteTrack 的原理................................................................ 194
5.4 基於ByteTrack 的多目標跟蹤項目實踐 ........................................................196
5.4.1 MOT16 數據集...................................................................................196
5.4.2 Byte 匹配.............................................................................................197
5.5 本章小結..........................................................................................................202
第6 章深度學習模型的落地和部署................................................................. 203
6.1 常見模型部署框架介紹 ..................................................................................203
6.1.1 TensorRT.............................................................................................204
6.1.2 NCNN..................................................................................................206
6.1.3 ONNX..................................................................................................206
6.2 OpenCV 圖像處理操作...................................................................................207
6.2.1 OpenCV 基本操作..............................................................................207
6.2.2 使用OpenCV 進行圖像預處理........................................................ 212
6.3 GPU 編程工具之CUDA .................................................................................216
6.3.1 CUDA 編程模型................................................................................217
6.3.2 CUDA 執行緒組織................................................................................223
6.3.3 CUDA 記憶體組織 ................................................................................239
6.3.4 GPU 硬體組織結構........................................................................... 242
6.3.5 CUDA 流 .............................................................................................245
6.4 模型框架之TensorRT......................................................................................249
6.4.1 使用TensorRT API 搭建網路結構..................................................... 250
6.4.2 從ONNX 檔案中導入網路結構定義................................................ 253
6.4.3 TensorRT 推理引擎的序列化與反序列化 ......................................... 254
6.4.4 TensorRT 的推理.................................................................................257
6.4.5 INT8 量化 ............................................................................................259
6.4.6 TensorRT 的外掛程式開發......................................................................... 261
6.5 TensorRT 模型部署實例 .................................................................................263
6.5.1 使用 OpenCV 進行前處理............................................................... 264
6.5.2 使用CUDA 加速前處理.................................................................... 265
6.5.3 使用TensorRT 對YOLOv5 進行推理加速 ....................................... 268
6.5.4 YOLOv5 的CPU 和CUDA 後處理 .................................................. 270
6.6 NCNN 模型部署..............................................................................................273
6.6.1 NCNN 部署流程 .................................................................................273
6.6.2 使用NCNN 部署NanoDet................................................................. 276
6.7 本章小結 ..........................................................................................................284
參考文獻............................................................................................................285
作者簡介
龔心滿,碩士,新能源汽車感知融合資深工程師。畢業於中國計量大學控制理論與控制工程專業。曾就職於華人運通自動駕駛科技有限公司,擔任深度學習高級工程師職位,負責ADAS感知項目的研發,現就職于吉咖智慧型機器人有限公司感知算法中心,負責高階自動駕駛的落地。同時還參與多本人工智慧書籍的撰寫,也是多個技術專欄的簽約作者。在安防和自動駕駛領域都有豐富的經驗。
江濤,北京航空航天大學學士,香港中文大學碩士。先後在明星初創公司、研究院、網際網路大廠、實驗室任職,專注於深度學習與計算機視覺領域的前沿研究、落地部署、AI產品化,是多個國際知名開源項目的活躍貢獻者和維護者,也是多個技術專欄的簽約作者。
梁功臣,碩士,新能源汽車軟體研發高級工程師。畢業於東北大學控制理論與控制工程專業。曾作為項目核心成員於中國科學院瀋陽自動化研究所參與相關國家863項目(仿生醫療假肢)的研發科研工作,現就職於蔚來汽車科技有限公司數字架構定義與集成部門。
胡佳慧,碩士,畢業於中國計量大學控制工程專業。現就職於遠景科技集團,負責新能源行業智慧型化項目的研發,同時也是多個知名開源項目的負責人。在人工智慧研發與落地方面有著豐富的經驗。