《圖像處理、分析與機器視覺(第3版)》是2014年出版的圖書,作者是Milan Sonka、艾海舟。
基本介紹
- 書名:圖像處理、分析與機器視覺
- 作者:Milan Sonka、、艾海舟
- ISBN:9787302236863
- 定價:69.5元
- 出版社:清華大學出版社
- 出版時間:2014年
- 裝幀:平裝
圖書簡介,目錄:,
圖書簡介
本書是為計算機專業圖像處理、圖像分析和機器視覺課程編寫的教材。
本書針對圖像處理、圖像分析和機器視覺領域的有關原理與技術展開了廣泛而深入的討論,包括圖像預處理、圖像分割、形狀表示與描述、物體識別與圖像理解、三維視覺、數學形態學圖像處理技術、離散圖像變換、圖像壓縮、紋理描述、運動分析等。本書力圖將複雜的概念通過具體示例用易於理解的算法來描述,提供了大量包含圖示和處理結果的插圖,特別有助於讀者的學習和理解。此外,本書還提供了豐富的參考文獻,既列出了那些經過時間考驗的經典論文,也列出了能反映未來發展方向的最新進展,適於讀者進一步深入探索。
本書覆蓋了十分廣泛的領域,包括人工智慧、信號處理、人工神經網路、模式識別、機器學習、模糊數學等一系列相關學科。讀者通過學習本書,可以學到很多具有普遍價值的知識和具體的套用方法。
本書可作為各高等院校計算機專業高年級本科生和研究生相應課程的教材,可以結合實際教學情況選用相應的章節。本書也特別適合有一定基礎的讀者自學。本書對從事相關科學技術領域的研究和工程技術人員也有很高的參考價值。此外,對於本領域的專業人士也可以作為技術手冊使用。
本書針對圖像處理、圖像分析和機器視覺領域的有關原理與技術展開了廣泛而深入的討論,包括圖像預處理、圖像分割、形狀表示與描述、物體識別與圖像理解、三維視覺、數學形態學圖像處理技術、離散圖像變換、圖像壓縮、紋理描述、運動分析等。本書力圖將複雜的概念通過具體示例用易於理解的算法來描述,提供了大量包含圖示和處理結果的插圖,特別有助於讀者的學習和理解。此外,本書還提供了豐富的參考文獻,既列出了那些經過時間考驗的經典論文,也列出了能反映未來發展方向的最新進展,適於讀者進一步深入探索。
本書覆蓋了十分廣泛的領域,包括人工智慧、信號處理、人工神經網路、模式識別、機器學習、模糊數學等一系列相關學科。讀者通過學習本書,可以學到很多具有普遍價值的知識和具體的套用方法。
本書可作為各高等院校計算機專業高年級本科生和研究生相應課程的教材,可以結合實際教學情況選用相應的章節。本書也特別適合有一定基礎的讀者自學。本書對從事相關科學技術領域的研究和工程技術人員也有很高的參考價值。此外,對於本領域的專業人士也可以作為技術手冊使用。
目錄:
目 錄
第1章 引言 1
1.1 動機 1
1.2 計算機視覺為什麼是困難的 2
1.3 圖像表達與圖像分析的任務 4
1.4 總結 7
1.5 參考文獻 7
第2章 圖像及其表達與性質 8
2.1 圖像表達若干概念 8
連續圖像函式 8
2.2 圖像數位化 10
2.2.1 採樣 10
2.2.2 量化 11
2.3 數字圖像性質 12
2.3.1 數字圖像的度量和
拓撲性質 12
2.3.2 直方圖 16
2.3.3 熵 17
2.3.4 圖像的視覺感知 18
2.3.5 圖像品質 20
2.3.6 圖像中的噪聲 20
2.4 彩色圖像 22
2.4.1 色彩物理學 22
2.4.2 人所感知的色彩 23
2.4.3 彩色空間 26
2.4.4 調色板圖像 28
2.4.5 顏色恆常性 28
2.5 攝像機概述 29
2.5.1 光敏感測器 29
2.5.2 黑白攝像機 30
2.5.3 彩色攝像機 32
2.6 總結 33
2.7 參考文獻 34
第3章 圖像及其數學與物理背景 35
3.1 概述 35
3.1.1 線性 35
3.1.2 狄拉克(Dirac)分布和
卷積 35
3.2 積分線性變換 37
3.2.1 作為線性系統的圖像 37
3.2.2 積分線性變換引言 37
3.2.3 1D傅立葉變換 38
3.2.4 2 D傅立葉變換 41
3.2.5 採樣與香農約束 43
3.2.6 離散餘弦變換 46
3.2.7 小波變換 47
3.2.8 本徵分析 51
3.2.9 奇異值分解 52
3.2.10 主分量分析 53
3.2.11 其他正交圖像變換 54
3.3 作為隨機過程的圖像 55
3.4 圖像形成物理 57
3.4.1 作為輻射測量的圖像 57
3.4.2 圖像獲取與幾何光學 57
3.4.3 鏡頭像差和徑向畸變 60
3.4.4 從輻射學角度看圖像獲取 62
3.4.5 表面反射 64
3.5 總結 67
3.6 參考文獻 67
第4章 圖像分析的數據結構 69
4.1 圖像數據表示的層次 69
4.2 傳統圖像數據結構 70
4.2.1 矩陣 70
4.2.2 鏈 72
4.2.3 拓撲數據結構 73
4.2.4 關係結構 73
4.3 分層數據結構 74
4.3.1 金字塔 74
4.3.2 四叉樹 75
4.3.3 其他金字塔結構 76
4.4 總結 77
4.5 參考文獻 78
第5章 圖像預處理 79
5.1 像素亮度變換 79
5.1.1 位置相關的亮度校正 80
5.1.2 灰度級變換 80
5.2 幾何變換 82
5.2.1 像素坐標變換 83
5.2.2 亮度插值 84
5.3 局部預處理 86
5.3.1 圖像平滑 86
5.3.2 邊緣檢測運算元 92
5.3.3 二階導數過零點 96
5.3.4 圖像處理中的尺度 98
5.3.5 Canny邊緣提取 100
5.3.6 參數化邊緣模型 102
5.3.7 多光譜圖像中的邊緣 103
5.3.8 頻域的局部預處理 103
5.3.9 用局部預處理運算元
作線檢測 108
5.3.10 角點(興趣點)檢測 109
5.3.11 最大穩定極值區域檢測 112
5.4 圖像復原 114
5.4.1 容易復原的退化 114
5.4.2 逆濾波 115
5.4.3 維納濾波 115
5.5 總結 117
5.6 參考文獻 118
第6章 分割 I 124
6.1 閾值化 124
6.1.1 閾值檢測方法 126
6.1.2 最優閾值化 127
6.1.3 多光譜閾值化 129
6.2 基於邊緣的分割 130
6.2.1 邊緣圖像閾值化 131
6.2.2 邊緣鬆弛法 133
6.2.3 邊界跟蹤 135
6.2.4 作為圖搜尋的邊緣跟蹤 139
6.2.5 作為動態規劃的邊緣跟蹤 146
6.2.6 Hough變換 149
6.2.7 使用邊界位置信息的
邊界檢測 155
6.2.8 從邊界構造區域 156
6.3 基於區域的分割 157
6.3.1 區域歸併 158
6.3.2 區域分裂 160
6.3.3 分裂與歸併 161
6.3.4 分水嶺分割 163
6.3.5 區域增長後處理 166
6.4 匹配 166
6.4.1 匹配標準 167
6.4.2 匹配的控制策略 168
6.5 分割的評測問題 169
6.5.1 監督式評測 169
6.5.2 非監督式評測 172
6.6 總結 172
6.7 參考文獻 175
第7章 分割II 182
7.1 均值移位分割 182
7.2 活動輪廓模型——蛇行 187
7.2.1 經典蛇行和氣球 188
7.2.2 擴展 191
7.2.3 梯度矢量流蛇 191
7.3 幾何變形模型——水平集和
測地活動輪廓 194
7.4 模糊連線性 200
7.5 面向基於3D圖的圖像分割 204
7.5.1 邊界對的同時檢測 205
7.5.2 次優的表面檢測 208
7.6 圖割分割 209
7.7 最優單和多表面分割 214
7.8 總結 223
7.9 參考文獻 224
第8章 形狀表示與描述 232
8.1 區域標識 234
8.2 基於輪廓的形狀表示與描述 236
8.2.1 鏈碼 237
8.2.2 簡單幾何邊界表示 237
8.2.3 邊界的傅立葉變換 239
8.2.4 使用片段序列的邊界描述 241
8.2.5 B樣條表示 243
8.2.6 其他基於輪廓的形狀
描述方法 245
8.2.7 形狀不變數 245
8.3 基於區域的形狀表示與描述 248
8.3.1 簡單的標量區域描述 248
8.3.2 矩 251
8.3.3 凸包 253
8.3.4 基於區域骨架的圖表示 257
8.3.5 區域分解 259
8.3.6 區域鄰近圖 260
8.4 形狀類別 261
8.5 總結 261
8.6 參考文獻 263
第9章 物體識別 270
9.1 知識表示 270
9.2 統計模式識別 274
9.2.1 分類原理 275
9.2.2 分類器設定 276
9.2.3 分類器學習 278
9.2.4 支持向量機 280
9.2.5 聚類分析 284
9.3 神經元網路 286
9.3.1 前饋網路 287
9.3.2 非監督學習 288
9.3.3 Hopfield神經元網路 289
9.4 句法模式識別 290
9.4.1 語法與語言 291
9.4.2 句法分析與句法分類器 293
9.4.3 句法分類器學習與
語法推導 294
9.5 作為圖匹配的識別 295
9.5.1 圖和子圖的同構 296
9.5.2 圖的相似度 298
9.6 識別中的最佳化技術 299
9.6.1 遺傳算法 300
9.6.2 模擬退火 302
9.7 模糊系統 303
9.7.1 模糊集和模糊隸屬函式 304
9.7.2 模糊集運算 305
9.7.3 模糊推理 306
9.7.4 模糊系統設計與訓練 308
9.8 模式識別中的Boosting方法 309
9.9 總結 311
9.10 參考文獻 314
第10章 圖像理解 319
10.1 圖像理解控制策略 320
10.1.1 並行和串列處理控制 320
10.1.2 分層控制 321
10.1.3 自底向上的控制 321
10.1.4 基於模型的控制 321
10.1.5 混合的控制策略 322
10.1.6 非分層控制 325
10.2 RANSAC:通過隨機抽樣一致
來擬合 326
10.3 點分布模型 329
10.4 活動表觀模型 337
10.5 圖像理解中的模式識別方法 344
10.5.1 基於分類的分割 344
10.5.2 上下文圖像分類 346
10.6 Boosted層疊分類器用於快速
物體檢測 349
10.7 場景標註和約束傳播 352
10.7.1 離散鬆弛法 353
10.7.2 機率鬆弛法 355
10.7.3 搜尋解釋樹 357
10.8 語義圖像分割和理解 357
10.8.1 語義區域增長 358
10.8.2 遺傳圖像解釋 360
10.9 隱馬爾可夫模型 365
10.9.1 套用 369
10.9.2 耦合的HMM 370
10.9.3 貝葉斯信念網路 371
10.10 高斯混合模型和期望最大化 372
10.11 總結 378
10.12 參考文獻 380
第11章 3D視覺和幾何 389
11.1 3D視覺任務 389
11.1.1 Marr理論 391
11.1.2 其他視覺範疇:主動和
有目的的視覺 392
11.2 射影幾何學基礎 393
11.2.1 射影空間中的點和超平面 394
11.2.2 單應性 395
11.2.3 根據對應點估計單應性 397
11.3 單透視攝像機 400
11.3.1 攝像機模型 400
11.3.2 齊次坐標系中的投影和
反投影 402
11.3.3 從已知場景標定一個
攝像機 403
11.4 從多視圖重建場景 403
11.4.1 三角測量 403
11.4.2 射影重建 404
11.4.3 匹配約束 405
11.4.4 光束平差法 406
11.4.5 升級射影重建和
自標定 407
11.5 雙攝像機和立體感知 408
11.5.1 極線幾何學——基本
矩陣 408
11.5.2 攝像機的相對運動
——本質矩陣 410
11.5.3 分解基本矩陣到
攝像機矩陣 411
11.5.4 從對應點估計基本矩陣 411
11.5.5 雙攝像機矯正結構 412
11.5.6 矯正計算 414
11.6 三攝像機和三視張量 415
11.6.1 立體對應點算法 417
11.6.2 距離圖像的主動獲取 421
11.7 由輻射測量到3D信息 423
11.7.1 由陰影到形狀 423
11.7.2 光度測量立體視覺 426
11.8 總結 427
11.9 參考文獻 428
第12章 3D視覺的套用 433
12.1 由X到形狀 433
12.1.1 由運動到形狀 433
12.1.2 由紋理到形狀 437
12.1.3 其他由X到形狀
的技術 439
12.2 完全的3D物體 440
12.2.1 3D物體、模型以及
相關問題 440
12.2.2 線條標註 441
12.2.3 體積表示和直接測量 443
12.2.4 體積建模策略 444
12.2.5 表面建模策略 446
12.2.6 為獲取完整3D模型的
面元標註與融合 447
12.3 基於3D模型的視覺 451
12.3.1 一般考慮 451
12.3.2 Goad算法 452
12.3.3 基於模型的亮度圖像
曲面物體識別 455
12.3.4 基於模型的距離
圖像識別 456
12.4 3D場景的2D視圖表達 456
12.4.1 觀察空間 456
12.4.2 多視圖表達和示象圖 457
12.4.3 作為2D視圖結構化
表達的幾何基元 457
12.4.4 利用存儲的2D視圖顯示
3D真實世界場景 458
12.5 實例研究——由未組織的2D
視圖集重建3D 460
12.6 總結 463
12.7 參考文獻 464
第13章 數學形態學 470
13.1 形態學基本概念 470
13.2 形態學四原則 471
13.3 二值膨脹和腐蝕 472
13.3.1 膨脹 472
13.3.2 腐蝕 474
13.3.3 擊中擊不中變換 476
13.3.4 開運算和閉運算 476
13.4 灰度級膨脹和腐蝕 477
13.4.1 頂面、本影、灰度級
膨脹和腐蝕 477
13.4.2 本影同胚定理和膨脹、
腐蝕及開、閉運算的
性質 479
13.4.3 頂帽變換 480
13.5 骨架和物體標記 481
13.5.1 同倫變換 481
13.5.2 骨架和最大球 481
13.5.3 細化、粗化和同倫骨架 482
13.5.4 熄滅函式和最終腐蝕 485
13.5.5 最終腐蝕和距離函式 486
13.5.6 測地變換 487
13.5.7 形態學重構 488
13.6 粒度測定法 489
13.7 形態學分割與分水嶺 491
13.7.1 粒子分割、標記和
分水嶺 491
13.7.2 二值形態學分割 491
13.7.3 灰度級分割和分水嶺 493
13.8 總結 494
13.9 參考文獻 495
第14章 圖像數據壓縮 497
14.1 圖像數據性質 498
14.2 圖像數據壓縮中的離散
圖像變換 498
14.3 預測壓縮方法 500
14.4 矢量量化 502
14.5 分層的和漸進的壓縮方法 502
14.6 壓縮方法比較 503
14.7 其他技術 504
14.8 編碼 504
14.9 JPEG和MPEG圖像壓縮 505
14.9.1 JPEG——靜態圖像
壓縮 505
14.9.2 JPEG-2000壓縮 506
14.9.3 MPEG——全運動的
視頻壓縮 508
14.10 總結 509
14.11 參考文獻 511
第15章 紋理 514
15.1 統計紋理描述 516
15.1.1 基於空間頻率的方法 516
15.1.2 共生矩陣 517
15.1.3 邊緣頻率 519
15.1.4 基元長度(行程) 520
15.1.5 Laws紋理能量度量 521
15.1.6 分形紋理描述 521
15.1.7 多尺度紋理描述
——小波域方法 522
15.1.8 其他紋理描述的
統計方法 525
15.2 句法紋理描述方法 526
15.2.1 形狀鏈語法 526
15.2.2 圖語法 527
15.2.3 分層紋理中的
基元分組 528
15.3 混合的紋理描述方法 530
15.4 紋理識別方法的套用 531
15.5 總結 531
15.6 參考文獻 532
第16章 運動分析 537
16.1 差分運動分析方法 539
16.2 光流 542
16.2.1 光流計算 542
16.2.2 全局和局部光流估計 544
16.2.3 局部和全局相結合的
光流估計 546
16.2.4 運動分析中的光流 546
16.3 基於興趣點對應關係的分析 549
16.3.1 興趣點的檢測 549
16.3.2 興趣點的對應關係 549
16.4 特定運動模式的檢測 551
16.5 視頻跟蹤 554
16.5.1 背景建模 554
16.5.2 基於核函式的跟蹤 558
16.5.3 目標路徑分析 562
16.6 輔助跟蹤的運動模型 566
16.6.1 卡爾曼濾波器 567
16.6.2 粒子濾波器 570
16.7 總結 573
16.8 參考文獻 575
辭彙 581