內容簡介
本書分上下兩篇介紹機器視覺的構成、圖像處理方法以及套用實例。上篇“機器視覺理論與算法”包括:機器視覺、圖像處理、目標提取、邊緣檢測、圖像平滑處理、幾何參數檢測、Hough變換、單目視覺測量、雙目符殃舟視覺測量、運動圖像處理、傅立葉變換、小波變換、模式識別、神經網路、深度學習、遺傳算法。下篇“寒鍵罪挨機器視覺套用系統”包括:通用圖像處理系統ImageSys、二維運動測量分析系統MIAS、三維運動測量分析系統MIAS 3D、車輛視覺導航系統。本書匯集了圖像處理絕大多數現有流行算法,以淺顯的圖文並茂的方法講解複雜的理論算法,每個算法都給出了實際處理案例。書中所講案例均來自生產實踐,都得到了實際套用的檢驗。本書不僅適用於機器視覺和圖像處理專業理論結合實踐的教學,對於本專業及相關專業的課題研究人員和專業技術人員也具有重要的參考價值。
圖書目錄
上篇 機器視覺理論與算法
第1章 機器視覺 / 2
1.1 機器視覺的作用 / 2
1.2 機器視覺的硬體構成 / 3
1.2.1 計算機 / 4
1.2.2 圖像採集設備 / 6
1.3 機器視覺的軟體及編程工具 / 7
1.4 機器視覺、機器人和智慧型裝備 / 8
1.5 機器視覺的功能與精度 / 9
第2章 圖像處理 / 12
2.1 圖像處理的發展過程 / 12
2.2 數字圖像的採樣與量化 / 18
2.3 彩色圖像與灰度圖像 / 20
2.4 圖像檔案及視頻檔案格式 再糠匙/ 22
2.5 數字圖像的計算機表述 / 23
2.6 常用圖像處理算法及其通用性問題 / 24
參考文獻 / 25
第3章 目標提取 / 26
3.1 如何提取目標物體 / 26
3.2 基於閾值的目標提取 / 26
3.2.1 二值化處理 / 26
3.2.2 閾值的確定 / 27
3.3 基於顏色的目標提取 / 30
3.3.1 色相、亮度、飽和度及其他 / 30
3.3.2 顏色分量及其組合處理 / 33
3.4 歸刪晚鴉基於差分的目標提取 / 38
3.4.1 幀間差分 / 38
3.4.2 背景差分 / 39
參考文獻 / 40
第4章 邊緣檢測 / 42
4.1 邊緣與圖像處理 / 42
4.2 基於微分的邊緣檢測 / 44
4.3 基於模板匹配的邊緣檢測 / 45
4.4 邊緣圖像的二值化處理 / 47
4.5 細線化處理 / 48
4.6 Canny算法 / 48
參考文獻 / 52
第5章 圖像平滑處理 / 53
5.1 圖像噪聲及常用平滑方式 / 53
5.2 移動平均 / 54
5.3 中值濾波 / 54
5.4 高斯濾波 / 56
5.5 模糊圖像的清晰化處理 / 59
5.5.1 對比度增強 / 59
5.5.2 自動對比度增強 / 61
5.5.3 直方圖均衡化 / 63
5.5.4 暗通道先驗法去霧處理 / 65
5.6 二值圖像的平滑處理 / 67
參考文獻 / 69
第6章 幾何參數檢測 / 70
6.1 基於圖像特徵的自動識別 / 70
6.2 二值圖像的特徵參數 / 70
6.3 區域標記 / 73
6.4 基於特徵參數提取物體 / 74
6.5 基於特徵參數消除噪聲 / 75
參考文獻 / 76
第7章 Hough變換 / 77
7.1 傳統Hough變換的直線檢測 / 77
7.2 過已知點Hough變換的元辯直線檢測 / 79
7.3 Hough變換夜煮歸的曲線檢測 拜阿棕/ 81
參考文獻 / 81
第8章 幾何變換 / 82
8.1 關於幾何變換 / 82
8.2 放大縮小 / 83
8.3 平移 / 87
8.4 旋轉 / 87
8.5 複雜變形 / 88
8.6 齊次坐標表示 / 90
參考文獻 / 91
第9章 單目視覺測量 / 92
9.1 硬體構成 / 92
9.2 攝像機模型 / 93
9.2.1 參考坐標系 / 94
9.2.2 攝像機模型分析 / 95
9.3 攝像機標定 / 97
9.4 標定尺檢測 / 98
9.4.1 定位追蹤起始點 / 98
9.4.2 藍黃邊界檢測 / 100
9.4.3 確定角點坐標 / 102
9.4.4 單應矩陣計算 / 103
9.5 標定結果分析 / 103
9.6 標識點自動檢測 / 104
9.7 手動選取目標 / 110
9.8 距離測量分析 / 110
9.8.1 透視畸變對測距精度的影響 / 110
9.8.2 目標點與標定點的距離對測距精度的影響 /112
9.9 面積測量算法 / 113
9.9.1 獲取待測區域輪廓點集 / 113
9.9.2 小凸多邊形擬合 / 114
9.9.3 多邊形面積計算 / 115
9.9.4 測量實例 / 116
參考文獻 / 117
第10章 雙目視覺測量 / 118
10.1 雙目視覺系統的結構 / 118
10.1.1 平行式立體視覺模型 / 119
10.1.2 匯聚式立體視覺模型 / 120
10.2 攝像機標定 / 122
10.2.1 直接線性標定法 / 123
10.2.2 張正友標定法 / 124
10.2.3 攝像機參數與投影矩陣的轉換 / 128
10.3 標定測量試驗 / 129
10.3.1 直接線性標定法試驗 / 130
10.3.2 張正友標定法試驗 / 131
10.3.3 三維測量試驗 / 134
參考文獻 / 135
第11章 運動圖像處理 / 136
11.1 光流法 / 136
11.1.1 光流法的基本概念 / 136
11.1.2 光流法用於目標跟蹤的原理 / 137
11.2 模板匹配 / 138
11.3 運動圖像處理實例 /139
11.3.1 羽毛球技戰術實時圖像檢測 / 139
11.3.2 蜜蜂舞蹈行為分析 / 145
參考文獻 / 154
第12章 傅立葉變換 / 155
12.1 頻率的世界 / 155
12.2 頻率變換 / 156
12.3 離散傅立葉變換 / 159
12.4 圖像的二維傅立葉變換 / 161
12.5 濾波處理 / 162
參考文獻 / 163
第13章 小波變換 / 164
13.1 小波變換概述 / 164
13.2 小波與小波變換 / 165
13.3 離散小波變換 / 167
13.4 小波族 / 167
13.5 信號的分解與重構 / 168
13.6 圖像處理中的小波變換 / 175
13.6.1 二維離散小波變換 / 175
13.6.2 圖像的小波變換編程 / 177
參考文獻 / 179
第14章 模式識別 / 180
14.1 模式識別與圖像識別的概念 / 180
14.2 圖像識別系統的組成 / 181
14.3 圖像識別與圖像處理和圖像理解的關係 / 182
14.4 圖像識別方法 / 183
14.4.1 模板匹配方法 / 183
14.4.2 統計模式識別 / 183
14.4.3 新的模式識別方法 / 187
14.5 人臉圖像識別系統 /189
參考文獻 / 192
第15章 神經網路 / 193
15.1 人工神經網路 / 193
15.1.1 人工神經網路的生物學基礎 / 194
15.1.2 人工神經元 / 195
15.1.3 人工神經元的學習 / 195
15.1.4 人工神經元的激活函式 / 196
15.1.5 人工神經網路的特點 / 197
15.2 BP神經網路 / 198
15.2.1 BP神經網路簡介 / 198
15.2.2 BP神經網路的訓練學習 / 200
15.2.3 改進型BP神經網路 / 202
15.3 BP神經網路在數字字元識別中的套用 / 203
15.3.1 BP神經網路數字字元識別系統原理 / 204
15.3.2 網路模型的建立 / 205
15.3.3 數字字元識別演示 / 207
參考文獻 / 209
第16章 深度學習 / 210
16.1 深度學習的發展歷程 / 210
16.2 深度學習的基本思想 / 212
16.3 淺層學習和深度學習 / 212
16.4 深度學習與神經網路 / 213
16.5 深度學習訓練過程 / 214
16.6 深度學習的常用方法 / 215
16.6.1 自動編碼器 / 215
16.6.2 稀疏編碼 / 218
16.6.3 限制波爾茲曼機 / 220
16.6.4 深信度網路 / 222
16.6.5 卷積神經網路 / 225
16.7 基於卷積神經網路的手寫體字識別 / 228
16.7.1 手寫字識別的卷積神經網路結構 / 228
16.7.2 卷積神經網路文字識別的實現 / 231
參考文獻 / 231
第17章 遺傳算法 / 232
17.1 遺傳算法概述 / 232
17.2 簡單遺傳算法 / 234
17.2.1 遺傳表達 / 234
17.2.2 遺傳運算元 / 235
17.3 遺傳參數 / 238
17.3.1 交叉率和變異率 / 238
17.3.2 其他參數 / 238
17.3.3 遺傳參數的確定 / 238
17.4 適應度函式 / 239
17.4.1 目標函式映射為適應度函式 / 239
17.4.2 適應度函式的尺度變換 / 240
17.4.3 適應度函式設計對GA 的影響 / 241
17.5 模式定理 / 242
17.5.1 模式的幾何解釋 / 244
17.5.2 模式定理 / 246
17.6 遺傳算法在模式識別中的套用 / 248
17.6.1 問題的設定 / 248
17.6.2 GA的套用方法 / 250
17.6.3 基於GA的雙目視覺匹配 / 252
參考文獻 / 255
下篇 機器視覺套用系統
第18章 通用圖像處理系統ImageSys / 258
18.1 系統簡介 / 258
18.2 狀態窗 / 259
18.3 圖像採集 / 259
18.3.1 DirectX直接採集 / 259
18.3.2 VFW PC相機採集 / 260
18.3.3 A/D圖像卡採集 / 260
18.4 直方圖處理 / 261
18.4.1 直方圖 / 261
18.4.2 線剖面 / 261
18.4.3 3D剖面 / 262
18.4.4 累計分布圖 / 263
18.5 顏色測量 / 264
18.6 顏色變換 / 264
18.6.1 顏色亮度變換 / 264
18.6.2 HSI表示變換 / 265
18.6.3 自由變換 / 265
18.6.4 RGB顏色變換 / 266
18.7 幾何變換 / 266
18.7.1 仿射變換 / 266
18.7.2 透視變換 / 267
18.8 頻率域變換 / 267
18.8.1 小波變換 / 267
18.8.2 傅立葉變換 / 268
18.9 圖像間變換 / 270
18.9.1 圖像間演算 / 270
18.9.2 運動圖像校正 / 270
18.10 濾波增強 / 271
18.10.1 單模板濾波增強 / 271
18.10.2 多模板濾波增強 / 272
18.10.3 Canny邊緣檢測 / 273
18.11 圖像分割 / 273
18.12 二值運算 / 274
18.12.1 基本運算 / 274
18.12.2 特殊提取 / 275
18.13 二值圖像測量 / 276
18.13.1 幾何參數測量 / 276
18.13.2 直線參數測量 / 281
18.13.3 圓形分離 / 281
18.13.4 輪廓測量 / 281
18.14 幀編輯 / 282
18.15 畫圖 / 283
18.16 查看 / 284
18.17 檔案 / 284
18.17.1 圖像檔案 / 284
18.17.2 多媒體檔案 / 286
18.17.3 多媒體檔案編輯 / 289
18.17.4 添加水印 / 290
18.18 系統設定 / 291
18.18.1 系統幀設定 / 291
18.18.2 系統語言設定 / 292
18.19 系統開發平台Sample / 293
參考文獻 / 293
第19章 二維運動圖像測量分析系統MIAS / 294
19.1 系統概述 / 294
19.2 檔案 / 295
19.3 運動圖像及2D比例標定 / 296
19.4 運動測量 / 298
19.4.1 自動測量 / 298
19.4.2 手動測量 / 301
19.4.3 標識測量 / 302
19.5 結果瀏覽 / 305
19.5.1 結果視頻表示 / 305
19.5.2 位置速率 / 308
19.5.3 偏移量 / 310
19.5.4 2點間距離 / 311
19.5.5 2線間夾角 / 311
19.5.6 連線線圖一覽 / 312
19.6 結果修正 / 313
19.6.1 手動修正 / 313
19.6.2 平滑化 / 313
19.6.3 內插補間 / 314
19.6.4 幀坐標變換 / 314
19.6.5 人體重心測量 / 314
19.6.6 設定事項 / 315
19.7 查看 / 315
19.8 實時測量 / 315
19.8.1 實時目標測量 / 315
19.8.2 實時標識測量 / 316
19.9 開發平台MSSample / 316
參考文獻 / 317
第20章 三維運動測量分析系統MIAS 3D / 318
20.1 MIAS 3D系統簡介 / 318
20.2 檔案 / 319
20.3 2D結果導入、3D標定及測量 / 319
20.4 顯示結果 / 321
20.4.1 視頻表示 / 322
20.4.2 點位速率 / 323
20.4.3 位移量 / 323
20.4.4 2點間距離 / 324
20.4.5 2線間夾角 / 325
20.4.6 連線線一覽圖 / 326
20.5 結果修正 / 326
20.6 其他功能 / 327
參考文獻 / 327
第21章 車輛視覺導航系統 / 328
21.1 車輛無人駕駛的發展歷程及趨勢 / 328
21.2 視覺導航系統的硬體 / 330
21.3 視覺導航系統的軟體 / 331
21.4 導航試驗及性能測試比較 / 334
索引 / 337
4.2 基於微分的邊緣檢測 / 44
4.3 基於模板匹配的邊緣檢測 / 45
4.4 邊緣圖像的二值化處理 / 47
4.5 細線化處理 / 48
4.6 Canny算法 / 48
參考文獻 / 52
第5章 圖像平滑處理 / 53
5.1 圖像噪聲及常用平滑方式 / 53
5.2 移動平均 / 54
5.3 中值濾波 / 54
5.4 高斯濾波 / 56
5.5 模糊圖像的清晰化處理 / 59
5.5.1 對比度增強 / 59
5.5.2 自動對比度增強 / 61
5.5.3 直方圖均衡化 / 63
5.5.4 暗通道先驗法去霧處理 / 65
5.6 二值圖像的平滑處理 / 67
參考文獻 / 69
第6章 幾何參數檢測 / 70
6.1 基於圖像特徵的自動識別 / 70
6.2 二值圖像的特徵參數 / 70
6.3 區域標記 / 73
6.4 基於特徵參數提取物體 / 74
6.5 基於特徵參數消除噪聲 / 75
參考文獻 / 76
第7章 Hough變換 / 77
7.1 傳統Hough變換的直線檢測 / 77
7.2 過已知點Hough變換的直線檢測 / 79
7.3 Hough變換的曲線檢測 / 81
參考文獻 / 81
第8章 幾何變換 / 82
8.1 關於幾何變換 / 82
8.2 放大縮小 / 83
8.3 平移 / 87
8.4 旋轉 / 87
8.5 複雜變形 / 88
8.6 齊次坐標表示 / 90
參考文獻 / 91
第9章 單目視覺測量 / 92
9.1 硬體構成 / 92
9.2 攝像機模型 / 93
9.2.1 參考坐標系 / 94
9.2.2 攝像機模型分析 / 95
9.3 攝像機標定 / 97
9.4 標定尺檢測 / 98
9.4.1 定位追蹤起始點 / 98
9.4.2 藍黃邊界檢測 / 100
9.4.3 確定角點坐標 / 102
9.4.4 單應矩陣計算 / 103
9.5 標定結果分析 / 103
9.6 標識點自動檢測 / 104
9.7 手動選取目標 / 110
9.8 距離測量分析 / 110
9.8.1 透視畸變對測距精度的影響 / 110
9.8.2 目標點與標定點的距離對測距精度的影響 /112
9.9 面積測量算法 / 113
9.9.1 獲取待測區域輪廓點集 / 113
9.9.2 小凸多邊形擬合 / 114
9.9.3 多邊形面積計算 / 115
9.9.4 測量實例 / 116
參考文獻 / 117
第10章 雙目視覺測量 / 118
10.1 雙目視覺系統的結構 / 118
10.1.1 平行式立體視覺模型 / 119
10.1.2 匯聚式立體視覺模型 / 120
10.2 攝像機標定 / 122
10.2.1 直接線性標定法 / 123
10.2.2 張正友標定法 / 124
10.2.3 攝像機參數與投影矩陣的轉換 / 128
10.3 標定測量試驗 / 129
10.3.1 直接線性標定法試驗 / 130
10.3.2 張正友標定法試驗 / 131
10.3.3 三維測量試驗 / 134
參考文獻 / 135
第11章 運動圖像處理 / 136
11.1 光流法 / 136
11.1.1 光流法的基本概念 / 136
11.1.2 光流法用於目標跟蹤的原理 / 137
11.2 模板匹配 / 138
11.3 運動圖像處理實例 /139
11.3.1 羽毛球技戰術實時圖像檢測 / 139
11.3.2 蜜蜂舞蹈行為分析 / 145
參考文獻 / 154
第12章 傅立葉變換 / 155
12.1 頻率的世界 / 155
12.2 頻率變換 / 156
12.3 離散傅立葉變換 / 159
12.4 圖像的二維傅立葉變換 / 161
12.5 濾波處理 / 162
參考文獻 / 163
第13章 小波變換 / 164
13.1 小波變換概述 / 164
13.2 小波與小波變換 / 165
13.3 離散小波變換 / 167
13.4 小波族 / 167
13.5 信號的分解與重構 / 168
13.6 圖像處理中的小波變換 / 175
13.6.1 二維離散小波變換 / 175
13.6.2 圖像的小波變換編程 / 177
參考文獻 / 179
第14章 模式識別 / 180
14.1 模式識別與圖像識別的概念 / 180
14.2 圖像識別系統的組成 / 181
14.3 圖像識別與圖像處理和圖像理解的關係 / 182
14.4 圖像識別方法 / 183
14.4.1 模板匹配方法 / 183
14.4.2 統計模式識別 / 183
14.4.3 新的模式識別方法 / 187
14.5 人臉圖像識別系統 /189
參考文獻 / 192
第15章 神經網路 / 193
15.1 人工神經網路 / 193
15.1.1 人工神經網路的生物學基礎 / 194
15.1.2 人工神經元 / 195
15.1.3 人工神經元的學習 / 195
15.1.4 人工神經元的激活函式 / 196
15.1.5 人工神經網路的特點 / 197
15.2 BP神經網路 / 198
15.2.1 BP神經網路簡介 / 198
15.2.2 BP神經網路的訓練學習 / 200
15.2.3 改進型BP神經網路 / 202
15.3 BP神經網路在數字字元識別中的套用 / 203
15.3.1 BP神經網路數字字元識別系統原理 / 204
15.3.2 網路模型的建立 / 205
15.3.3 數字字元識別演示 / 207
參考文獻 / 209
第16章 深度學習 / 210
16.1 深度學習的發展歷程 / 210
16.2 深度學習的基本思想 / 212
16.3 淺層學習和深度學習 / 212
16.4 深度學習與神經網路 / 213
16.5 深度學習訓練過程 / 214
16.6 深度學習的常用方法 / 215
16.6.1 自動編碼器 / 215
16.6.2 稀疏編碼 / 218
16.6.3 限制波爾茲曼機 / 220
16.6.4 深信度網路 / 222
16.6.5 卷積神經網路 / 225
16.7 基於卷積神經網路的手寫體字識別 / 228
16.7.1 手寫字識別的卷積神經網路結構 / 228
16.7.2 卷積神經網路文字識別的實現 / 231
參考文獻 / 231
第17章 遺傳算法 / 232
17.1 遺傳算法概述 / 232
17.2 簡單遺傳算法 / 234
17.2.1 遺傳表達 / 234
17.2.2 遺傳運算元 / 235
17.3 遺傳參數 / 238
17.3.1 交叉率和變異率 / 238
17.3.2 其他參數 / 238
17.3.3 遺傳參數的確定 / 238
17.4 適應度函式 / 239
17.4.1 目標函式映射為適應度函式 / 239
17.4.2 適應度函式的尺度變換 / 240
17.4.3 適應度函式設計對GA 的影響 / 241
17.5 模式定理 / 242
17.5.1 模式的幾何解釋 / 244
17.5.2 模式定理 / 246
17.6 遺傳算法在模式識別中的套用 / 248
17.6.1 問題的設定 / 248
17.6.2 GA的套用方法 / 250
17.6.3 基於GA的雙目視覺匹配 / 252
參考文獻 / 255
下篇 機器視覺套用系統
第18章 通用圖像處理系統ImageSys / 258
18.1 系統簡介 / 258
18.2 狀態窗 / 259
18.3 圖像採集 / 259
18.3.1 DirectX直接採集 / 259
18.3.2 VFW PC相機採集 / 260
18.3.3 A/D圖像卡採集 / 260
18.4 直方圖處理 / 261
18.4.1 直方圖 / 261
18.4.2 線剖面 / 261
18.4.3 3D剖面 / 262
18.4.4 累計分布圖 / 263
18.5 顏色測量 / 264
18.6 顏色變換 / 264
18.6.1 顏色亮度變換 / 264
18.6.2 HSI表示變換 / 265
18.6.3 自由變換 / 265
18.6.4 RGB顏色變換 / 266
18.7 幾何變換 / 266
18.7.1 仿射變換 / 266
18.7.2 透視變換 / 267
18.8 頻率域變換 / 267
18.8.1 小波變換 / 267
18.8.2 傅立葉變換 / 268
18.9 圖像間變換 / 270
18.9.1 圖像間演算 / 270
18.9.2 運動圖像校正 / 270
18.10 濾波增強 / 271
18.10.1 單模板濾波增強 / 271
18.10.2 多模板濾波增強 / 272
18.10.3 Canny邊緣檢測 / 273
18.11 圖像分割 / 273
18.12 二值運算 / 274
18.12.1 基本運算 / 274
18.12.2 特殊提取 / 275
18.13 二值圖像測量 / 276
18.13.1 幾何參數測量 / 276
18.13.2 直線參數測量 / 281
18.13.3 圓形分離 / 281
18.13.4 輪廓測量 / 281
18.14 幀編輯 / 282
18.15 畫圖 / 283
18.16 查看 / 284
18.17 檔案 / 284
18.17.1 圖像檔案 / 284
18.17.2 多媒體檔案 / 286
18.17.3 多媒體檔案編輯 / 289
18.17.4 添加水印 / 290
18.18 系統設定 / 291
18.18.1 系統幀設定 / 291
18.18.2 系統語言設定 / 292
18.19 系統開發平台Sample / 293
參考文獻 / 293
第19章 二維運動圖像測量分析系統MIAS / 294
19.1 系統概述 / 294
19.2 檔案 / 295
19.3 運動圖像及2D比例標定 / 296
19.4 運動測量 / 298
19.4.1 自動測量 / 298
19.4.2 手動測量 / 301
19.4.3 標識測量 / 302
19.5 結果瀏覽 / 305
19.5.1 結果視頻表示 / 305
19.5.2 位置速率 / 308
19.5.3 偏移量 / 310
19.5.4 2點間距離 / 311
19.5.5 2線間夾角 / 311
19.5.6 連線線圖一覽 / 312
19.6 結果修正 / 313
19.6.1 手動修正 / 313
19.6.2 平滑化 / 313
19.6.3 內插補間 / 314
19.6.4 幀坐標變換 / 314
19.6.5 人體重心測量 / 314
19.6.6 設定事項 / 315
19.7 查看 / 315
19.8 實時測量 / 315
19.8.1 實時目標測量 / 315
19.8.2 實時標識測量 / 316
19.9 開發平台MSSample / 316
參考文獻 / 317
第20章 三維運動測量分析系統MIAS 3D / 318
20.1 MIAS 3D系統簡介 / 318
20.2 檔案 / 319
20.3 2D結果導入、3D標定及測量 / 319
20.4 顯示結果 / 321
20.4.1 視頻表示 / 322
20.4.2 點位速率 / 323
20.4.3 位移量 / 323
20.4.4 2點間距離 / 324
20.4.5 2線間夾角 / 325
20.4.6 連線線一覽圖 / 326
20.5 結果修正 / 326
20.6 其他功能 / 327
參考文獻 / 327
第21章 車輛視覺導航系統 / 328
21.1 車輛無人駕駛的發展歷程及趨勢 / 328
21.2 視覺導航系統的硬體 / 330
21.3 視覺導航系統的軟體 / 331
21.4 導航試驗及性能測試比較 / 334
索引 / 337