內容簡介
計算機視覺的套用越來越廣泛,已經成功地套用到機器人、自動駕駛、醫學成像和診斷、監控、視頻分析等領域,甚至已將跟蹤用於體育分析中。本書為讀者提供了重要的數學和算法工具,使他們能夠深入了解完整的計算機視覺系統的基本組成部分,並設計出同樣的系統。書中內容包括識別局部特徵,如在存在噪聲的情況下角或邊的識別、確保邊緣平滑、連通分量的標記、立體視覺、閾值處理、聚類、分割,以及描述、匹配形狀和場景等。
本書使用了各種廣泛的例子,包括面部圖片、卡通圖片、動物腳印和血管造影圖片等等。另外,每章章末都留有對應作業和建議實驗的項目。
本書可以作為高年級本科生和低年級研究生的參考用書,也可以作為從事計算機視覺技術研究的從業者和科技人員的參考用書。
圖書目錄
譯者序
前言
致老師
第一部分 導論
第1章 計算機視覺的定義及其歷史2
1.1 簡介2
1.2 定義2
1.3 局部全局問題3
1.4 生物視覺4
1.4.1 生物動因4
1.4.2 視覺感知6
參考文獻7
第2章 編寫圖像處理程式8
2.1 簡介8
2.2 圖像處理的基本程式結構8
2.3 良好的編程風格9
2.4 計算機視覺的重點9
2.5 圖像分析軟體工具包10
2.6 makefile10
2.7 作業11
參考文獻11
第3章 數學原理回顧12
3.1 簡介12
3.2 線性代數簡要回顧12
3.2.1 向量12
3.2.2 向量空間14
3.2.3 零空間15
3.2.4 函式空間16
3.2.5 線性變換17
3.2.6 導數和導數運算元19
3.2.7 特徵值和特徵向量20
3.2.8 特徵分解21
3.2.9 奇異值分解21
3.3 函式最小化簡要回顧23
3.3.1 梯度下降23
3.3.2 局部最小值和全局最小值26
3.3.3 模擬退火27
3.4 機率論簡要回顧28
3.5 作業30
參考文獻31
第4章 圖像:表示和創建32
4.1 簡介32
4.2 圖像表示32
4.2.1 標誌性表示(圖像)32
4.2.2 函式表示(方程)34
4.2.3 線性表示(向量)34
4.2.4 機率表示(隨機場)35
4.2.5 圖形表示(圖)35
4.2.6 鄰接悖論和六邊形像素36
4.3 作為曲面的圖像38
4.3.1 梯度38
4.3.2 等值線38
4.3.3 脊39
4.4 作業39
參考文獻40
第二部分 預處理
第5章 卷積核運算元42
5.1 簡介42
5.2 線性運算元42
5.3 圖像的向量表示44
5.4 導數估計45
5.4.1 使用核估計導數46
5.4.2 通過函式擬合來估計導數46
5.4.3 圖像基向量49
5.4.4 核作為採樣可微分函式50
5.4.5 其他高階導數53
5.4.6 尺度簡介54
5.5 邊緣檢測55
5.6 尺度空間58
5.6.1 金字塔58
5.6.2 沒有重採樣的尺度空間59
5.7 示例61
5.8 數字梯度檢測器的性能63
5.8.1 方嚮導數63
5.8.2 方向估計67
5.8.3 討論70
5.9 總結71
5.10 作業71
參考文獻76
第6章 去噪78
6.1 簡介78
6.2 圖像平滑78
6.2.1 一維情況79
6.2.2 二維情況79
6.3 使用雙邊濾波器實現保邊平滑82
6.4 使用擴散方程實現保邊平滑84
6.4.1 一維空間的擴散方程84
6.4.2 PDE模擬85
6.4.3 二維空間的擴散方程85
6.4.4 可變電導擴散86
6.5 使用最佳化實現保邊平滑87
6.5.1 噪聲消除的目標函式87
6.5.2 尋找一個先驗項90
6.5.3 MAP算法實現和均場退火92
6.5.4 病態問題和正則化94
6.6 等效算法95
6.7 總結97
6.8 作業97
參考文獻99
第7章 數學形態學101
7.1 簡介101
7.2 二值形態學101
7.2.1 膨脹101
7.2.2 腐蝕106
7.2.3 膨脹和腐蝕的性質107
7.2.4 開運算和閉運算108
7.2.5 開運算和閉運算的性質109
7.3 灰度形態學109
7.3.1 使用平面結構元素的灰度圖像110
7.3.2 使用灰度結構元素的灰度圖像113
7.3.3 使用集合運算的灰度形態學114
7.4 距離變換114
7.4.1 使用疊代最近鄰計算DT115
7.4.2 使用二值形態運算計算DT115
7.4.3 使用掩碼計算DT115
7.4.4 使用維諾圖計算DT117
7.5 邊緣連結的套用117
7.6 總結120
7.7 作業121
參考文獻122
第三部分 圖像理解
第8章 分割124
8.1 簡介124
8.2 閾值:僅基於亮度的分割125
8.2.1 閾值的局部性質125
8.2.2 通過直方圖分析選擇閾值126
8.2.3 用高斯和擬合直方圖129
8.2.4 高斯混合模型與期望最大化130
8.3 聚類:基於顏色相似度的分割132
8.3.1 k-均值聚類133
8.3.2 均值移位聚類135
8.4 連線組件:使用區域增長的空間分割136
8.4.1 遞歸方法136
8.4.2 疊代方法138
8.4.3 示例套用139
8.5 使用主動輪廓進行分割140
8.5.1 snake:離散和連續140
8.5.2 水平集:包含邊或者不包含邊144
8.6 分水嶺:基於亮度曲面的分割151
8.7 圖割:基於圖論的分割156
8.7.1 目標函式157
8.7.2 求解目標函式158
8.8 使用MFA進行分割159
8.9 評估分割的質量160
8.10 總結161
8.11 作業162
參考文獻163
第9章 參數變換167
9.1 簡介167
9.2 霍夫變換168
9.2.1 垂線問題169
9.2.2 如何找到交點——累加器數組169
9.2.3 使用梯度降低計算複雜度170
9.3 尋找圓171
9.3.1 由任意三個非共線像素表示的圓的位置推導171
9.3.2 當原點未知但半徑已知時找圓172
9.3.3 利用梯度信息減少找圓的計算172
9.4 尋找橢圓172
9.5 廣義霍夫變換174
9.6 尋找峰值175
9.7 尋找三維形狀——高斯圖176
9.8 尋找對應體——立體視覺中的參數一致性177
9.9 總結179
9.10 作業179
參考文獻
作者簡介
韋斯利•E.斯奈德(Wesley E. Snyder) 北卡羅來納州立大學電氣與計算機工程榮譽教授。他曾是Bowman Gray醫學院的教授,曾在GE公司研究與發展中心、NASA Langley 研究中心和西德航空航天局(DLR) 工作。他發表了179 篇研究論文,並於1993 年被北卡羅來納大學評為傑出工程教育家。他曾獲得IEEE Gladden 研究員(西澳大利亞大學) 和美國醫學和生物醫學工程研究所研究員等稱號。
戚海蓉(Hairong Qi) 田納西州諾克斯維爾大學電子工程和計算機科學專業的岡薩雷斯家庭教授。她的研究方向包括協作信號信息處理、圖像處理、高光譜成像和生物信息學。她是NSF CAREER 獎的獲得者,在國際會議上獲得了多項最佳論文獎,並在2012 年獲得IEEE 地球科學和遙感學會頒發的*高影響力論文獎。
譯者簡介:
張岩
南京大學計算機科學與技術系副教授。2006年于吉林大學獲得計算機博士學位。2008年於南京大學博士後流動站出站。研究方向包括基於三維幾何的計算機視覺、基於數據驅動的三維數據分析等。發表TOG、CVPR、C&G等多篇論文。曾獲得教育部科學技術進步獎二等獎。主持完成國家自然青年基金、江蘇省自然基金、江蘇省產學研聯合項目等多項項目。