計算機視覺套用與實戰

《計算機視覺套用與實戰》是2022年5月電子工業出版社出版圖書,作者是韓少雲等。

圍繞計算機視覺在農業、醫學、工業等領域的案例,深入淺出地講解計算機視覺核心的模型與關鍵技術

基本介紹

  • 書名:計算機視覺套用與實戰
  • 作者:韓少雲 等
  • 出版社:電子工業出版社
  • 出版時間:2022年5月
  • 頁數:380 頁
  • 定價:109 元
  • 開本:16 開
  • ISBN:9787121432514
內容簡介,圖書目錄,作者簡介,

內容簡介

本書中的案例代碼可以在達內時代科技集團自主研發的 AIX-EBoard 人工智慧實驗平台上部署與實施,實現了教學場景化、學習趣味化。

圖書目錄

第 1 部分 基於 OpenCV 的傳統視覺套用
第 1 章 圖像生成 /2
1.1 圖像顯示 /3
1.1.1 使用 OpenCV 顯示圖像 /3
1.1.2 使用 Matplotlib 顯示圖像 /3
1.1.3 案例實現——使用OpenCV 顯示圖像 /3
1.1.4 案例實現——使用Matplotlib 顯示圖像 /5
1.2 圖像讀取 /6
1.2.1 使用 OpenCV 讀取圖像 /6
1.2.2 使用 Matplotlib 讀取圖像 /7
1.2.3 案例實現——使用OpenCV 讀取圖像 /7
1.2.4 案例實現——使用Matplotlib 讀取圖像 /9
1.3 圖像保存 /10
1.3.1 使用 OpenCV 保存圖像 /10
1.3.2 使用 Matplotlib 保存圖像/11
1.3.3 案例實現——使用OpenCV 保存圖像 /11
1.3.4 案例實現——使用Matplotlib 保存圖像 /14
本章總結 /16
作業與練習 /16
第 2 章 OpenCV 圖像處理(1) /17
2.1 圖像模糊 /17
2.1.1 均值濾波 /17
2.1.2 中值濾波 /18
2.1.3 高斯濾波 /18
2.1.4 案例實現 /18
2.2 圖像銳化 /21
2.2.1 圖像銳化簡介 /21
2.2.2 案例實現 /21
本章總結 /24
作業與練習 /24
第 3 章 OpenCV 圖像處理(2) /26
3.1 OpenCV 繪圖 /26
3.1.1 使用 OpenCV 繪製各種圖形 /26
3.1.2 案例實現 /27
3.2 圖像的幾何變換 /31
3.2.1 幾何變換操作 /31
3.2.2 案例實現 /32
本章總結 /38
作業與練習 /38
第 4 章 圖像特徵檢測 /40
4.1 邊緣編輯和增強 /41
4.1.1 Canny 邊緣檢測簡介 /41
4.1.2 案例實現 /42
4.2 圖像輪廓檢測 /44
4.2.1 輪廓查找步驟 /45
4.2.2 查找輪廓函式 /45
4.2.3 繪製輪廓函式 /45
4.2.4 案例實現 /46
4.3 圖像角點和線條檢測 /48
4.3.1 角點的定義 /48
4.3.2 Harris 角點簡介 /48
4.3.3 Harris 角點檢測函式 /49
4.3.4 案例實現 /49
本章總結 /51
作業與練習 /52
第 5 章 圖像特徵匹配 /53
5.1 ORB 關鍵點檢測與匹配 /53
5.1.1 FAST 算法 /54
5.1.2 BRIEF 算法 /55
5.1.3 特徵匹配 /56
5.1.4 代碼流程 /56
5.2 案例實現 /57
本章總結 /59
作業與練習 /59
第 6 章 圖像對齊與拼接 /60
6.1 全景圖像拼接 /60
6.1.1 全景圖像的拼接原理 /61
6.1.2 算法步驟 /61
6.1.3 Ransac 算法介紹 /62
6.1.4 全景圖像剪裁 /63
6.2 案例實現 /64
本章總結 /67
作業與練習 /67
第 7 章 相機運動估計 /68
7.1 雙目相機運動估計 /68
7.1.1 相機測距流程 /68
7.1.2 雙目相機成像模型 /69
7.1.3 極限約束 /70
7.1.4 雙目測距的優勢 /70
7.1.5 雙目測距的難點 /70
7.2 案例實現 /72
本章總結 /82
作業與練習 /83
第 2 部分 基於機器學習和深度學習的視覺套用
第 8 章 基於 SVM 模型的手寫數字識別/85
8.1 手寫數字識別 /85
8.1.1 手寫數字圖像 /85
8.1.2 圖像處理 /86
8.2 案例實現 /87
本章總結 /95
作業與練習 /95
第 9 章 基於 HOG+SVM 的行人檢測 /96
9.1 行人檢測 /96
9.1.1 HOG+SVM /96
9.1.2 檢測流程 /97
9.1.3 滑動視窗 /98
9.1.4 非極大值抑制 /100
9.2 案例實現 /101
本章總結 /109
作業與練習 /109
第 10 章 數據標註 /110
10.1 目標檢測數據標註 /110
10.1.1 數據收集與數據標註 /111
10.1.2 數據標註的通用規則 /112
10.1.3 案例實現 /113
10.2 視頻目標跟蹤數據標註 /118
10.2.1 視頻與圖像數據標註的差異 /118
10.2.2 案例實現 /119
本章總結 /127
作業與練習 /127
第 11 章 水果識別 /128
11.1 LeNet-5 模型的訓練與評估 /128
11.1.1 卷積層 /129
11.1.2 池化層 /130
11.1.3 ReLU 層 /131
11.1.4 LeNet-5 模型 /131
11.1.5 Keras /132
11.1.6 案例實現 /133
11.2 LeNet-5 模型的套用 /139
11.2.1 使用 OpenCV 操作攝像頭 /139
11.2.2 OpenCV 的繪圖功能 /140
11.2.3 OpenCV 繪圖函式的常見參數 /140
11.2.4 Keras 模型的保存和載入 /140
11.2.5 案例實現 /142
本章總結 /145
作業與練習 /145
第 12 章 病蟲害識別 /147
12.1 植物葉子病蟲害識別 /147
12.1.1 PlantVillage 數據集 /148
12.1.2 性能評估 /148
12.1.3 感受野 /149
12.2 案例實現 /149
本章總結 /161
作業與練習 /162
第 13 章 相似圖像搜尋 /163
13.1 以圖搜圖 /163
13.1.1 VGG 模型 /164
13.1.2 H5 模型檔案 /165
13.1.3 案例實現 /166
13.2 人臉識別 /173
13.2.1 人臉檢測 /173
13.2.2 分析面部特徵 /174
13.2.3 人臉識別特徵提取 /175
13.2.4 人臉相似性比較 /176
13.2.5 案例實現 /176
本章總結 /184
作業與練習 /185
第 14 章 多目標檢測 /186
14.1 人臉口罩佩戴檢測 /186
14.1.1 目標檢測 /187
14.1.2 YOLO 模型 /188
14.1.3 YOLOv3 模型 /190
14.1.4 YOLOv3-Tiny 模型 /191
14.2 案例實現 /192
本章總結 /198
作業與練習 /198
第 15 章 可採摘作物檢測 /199
15.1 番茄成熟度檢測 /199
15.1.1 數據集 /200
15.1.2 RCNN 模型 /201
15.1.3 SPP-Net 模型 /202
15.1.4 Fast-RCNN 模型 /202
15.1.5 Faster-RCNN 模型 /202
15.1.6 Mask-RCNN 模型 /203
15.2 案例實現 /204
本章總結 /213
作業與練習 /213
第 16 章 智慧型照片編輯 /214
16.1 圖像自動著色 /214
16.1.1 GAN 模型的基本結構與原理 /215
16.1.2 構建 GAN 模型 /216
16.2 案例實現 /218
本章總結 /225
作業與練習 /225
第 17 章 超解析度 /227
17.1 圖像超解析度 /227
17.1.1 SRGAN 模型的結構 /228
17.1.2 SRGAN 模型的損失函式 /229
17.1.3 SRGAN 模型的評價指標 /230
17.2 案例實現 /230
本章總結 /237
作業與練習 /238
第 18 章 醫學圖像分割 /239
18.1 眼底血管圖像分割 /239
18.1.1 圖像分割 /240
18.1.2 語義分割 /241
18.1.3 全卷積神經網路 /243
18.1.4 反卷積 /244
18.1.5 U-Net 模型 /244
18.2 案例實現 /245
本章總結 /253
作業與練習 /253
第 19 章 醫學圖像配準 /255
19.1 頭頸部 CT 圖像配準 /255
19.1.1 圖像配準方法 /256
19.1.2 VoxelMorph 配準框架 /257
19.1.3 TensorFlow-pix2pix /259
19.2 案例實現 /260
本章總結 /265
作業與練習 /265
第 20 章 視頻內容分析 /267
20.1 人體動作識別 /267
20.1.1 視頻動作識別模型 /268
20.1.2 UCF-101 數據集 /269
20.2 案例實現 /270
本章總結 /275
作業與練習 /275
第 21 章 圖像語義理解 /277
21.1 視覺問答 /277
21.1.1 編碼器-解碼器模型 /279
21.1.2 光束搜尋 /281
21.2 案例實現 /282
本章總結 /288
作業與練習 /288
第 3 部分 基於深度學習的新興視覺套用
第 22 章 三維空間重建 /291
22.1 3D-R2N2 算法 /291
22.1.1 算法簡介 /292
22.1.2 算法的優勢 /292
22.1.3 算法的結構 /292
22.2 案例實現 /294
本章總結 /298
作業與練習 /298
第 23 章 視頻穩定 /300
23.1 人臉視頻穩定 /300
23.1.1 MobileNet 模型 /301
23.1.2 SSD 模型 /302
23.1.3 MobileNet-SSD 模型 /303
23.1.4 模型評估 /303
23.1.5 實時影響 /303
23.2 案例實現 /304
本章總結 /317
作業與練習 /317
第 24 章 目標檢測與跟蹤 /319
24.1 車輛檢測與跟蹤 /319
24.1.1 UA-DETRAC 數據集 /320
24.1.2 目標跟蹤 /322
24.1.3 DeepSORT 目標跟蹤 /323
24.2 案例實現 /324
本章總結 /337
作業與練習 /337
第 25 章 風格遷移 /339
25.1 圖像與視頻風格遷移 /339
25.1.1 理解圖像內容和圖像風格 /340
25.1.2 圖像重建 /341
25.1.3 風格重建 /342
25.2 案例實現 /343
本章總結 /354
作業與練習 /355
附錄 A 企業級綜合教學項目介紹 /356
1.1 智慧停車場管理系統 /356
1.1.1 項目概述 /356
1.1.2 技能目標 /358
1.2 智慧景區管理系統 /358
1.2.1 項目概述 /358
1.2.2 技能目標 /359
1.3 智慧型考勤打卡系統 /360
1.3.1 項目概述 /360
1.3.2 技能目標 /361

作者簡介

達內時代科技集團是國內知名的網際網路-IT教育培訓單位,是一站式網際網路人才基地,專注IT職業教育人才服務多年,擁有300多家培訓中心,幫助學員實現一地學習全國就業。

相關詞條

熱門詞條

聯絡我們