計算機視覺度量從特徵描述到深度學習

計算機視覺度量從特徵描述到深度學習

《計算機視覺度量從特徵描述到深度學習》是2019年人民郵電出版社出版的圖書,作者是[美] 斯科特·克里格(Scott Krig)。

基本介紹

  • 中文名:計算機視覺度量從特徵描述到深度學習 
  • 作者:[美] 斯科特·克里格(Scott Krig)
  • 出版社:人民郵電出版社
  • ISBN:9787115505880
內容簡介,作者簡介,目錄,

內容簡介

《計算機視覺度量拜拒腳蘭 從特徵描述到深度學習》全面介紹了計算機視覺中被廣泛使用的各種方法,包括局部特徵描述子、區域描述子、全局特徵描述子以及評價這些內容的度量方法和分類方法,並用將近一半的篇幅重點介紹了基於深度學習的特徵學習方法,以及FNN、RNN和BFN三類深度學習架構的特點。
《計算機視覺度量 從特徵描述到深度學習》內容豐富、前沿,強調理論分析,旨在甩幾跨探討各種計算機視覺研究方法背後的技術和原理,同時也探討了深度學習與神經科學之間的關係,展望了未來深度神經網路的發展方向。
《計算機視覺度量 從特徵描述到深度學習》用專門一章講解了計算機視覺流程和算法的最佳化,通過汽車識別、人臉檢測、圖像灑姜雄分類和增強現實等實例具體探討了硬體最佳化和軟體最佳化的方法。
《計算機視覺度量 從特徵描述到深度學習》每章末尾都配有相應的思考題,附錄給出了許多有效的實踐資源和一些有用的分析,同時提供了原始碼,既適合高校計算機視覺課程的教學,也適合從事計算機視覺的研究人員和工程技術人員參考使用。

作者簡介

作者簡介
Scott Krig 是計算機成像學、計算機視覺和圖形可視化方面的先驅。他在1988 年成立了Krig Research 公司,該公司提供了基於高性能工程工作站、超級計算機和專有硬體的成像和視覺系統,並為來自全球25 個國家的客戶提供服務。
近年來,Scott 主要為大型公司和服務於商業市場的初創公司提供服務,幫助它們解決計算機視覺、圖形成像、可視化、機器人、過程控制、工業自動化以及成像芝笑刪婚學和機器視覺在電子消費品(如筆記本電腦、手機和平板電腦)方面的套用問題。
Scott 也是全球範圍的許多專利套用的發明人,並在史丹福大學做過研究。
主要譯者簡介
劉波,副教授(博士),重慶工商大學計算機科學與信息工程學院教師,主要從事機器學習理論、計算機視覺技術研究,同時愛好Hadoop 和Spark 平台上的大數據分析。

目錄

第 1章 圖像的循櫃旬獲取和表示1
1.1 圖像感測器技術 1
1.1.1 傳淚愚感器材料 2
1.1.2 感測器光電二極體元件 3
1.1.3 感測器配置:馬賽克、Foveon和BSI 3
1.1.4 動態範圍、噪聲和超解析度 4
1.1.5 感測器處理 5
1.1.6 去馬賽克 5
1.1.7 壞像素校正 5
1.1.8 色彩和光照校正 6
1.1.9 幾何校正 6
1.2 照相機和計算成像 6
1.2.1 計算成像概述 7
1.2.2 單像素可計算相機 7
1.2.3 二維可計算照相機 8
1.2.4 三維深度的照相機系統 9
1.3 三維深度處理 18
1.3.1 方法概述 18
1.3.2 深度感知和處理中存在的問題 18
1.3.3 單目深度處理 23
1.4 三維表示:體元、深度圖、格線和點雲 26
1.5 總結 27
1.6 習題 27
第 2章 圖像預處理 29
2.1 圖像處理概述 29
2.2 圖像預處理要解決的問題 29
2.2.1 計算機視覺的流程和圖像預處理 30
2.2.2 圖像校正 31
2.2.3 圖像增強 31
2.2.4 為特徵提取準備圖像 32
2.3 圖像處理方法分類 36
2.3.1 點運算 36
2.3.2 直線運算 36
2.3.3 區域運算 37
2.3.4 算法 37
2.3.5 數據轉換 37
2.4 色彩學 37
2.4.1 色彩管理系統概述 38
2.4.2 光源、白點、黑點和中性軸 38
2.4.3 設備顏色模型 39
2.4.4 色彩空章堡盛間與色彩感知 39
2.4.5 色域映射與渲染的目標 40
2.4.6 色彩增強的實際考慮 41
2.4.7 色彩的準確度與精度 41
2.5 空間濾波 41
2.5.1 卷積濾波與檢測 41
2.5.2 核濾波與形狀選擇 43
2.5.3 點濾波 44
2.5.4 噪聲與偽像濾波 45
2.5.5 積分圖與方框濾波器 46
2.6 邊緣檢測器 46
2.6.1 核集合 47
2.6.2 Canny檢測器 48
2.7 變換濾波、Fourier變換及其他 48
2.7.1 Fourier變換 48
2.7.2 其他變換 50
2.8 形態學與分割 51
2.8.1 二值形態學 51
2.8.2 灰度和彩色形態學 52
2.8.3 形態學最佳化和改進 53
2.8.4 歐氏距離映射 53
2.8.5 超像素分割 53
2.8.6 深度圖分割 54
2.8.7 色彩分割 55
2.9 閾值化 55
2.9.1 全局閾值化 56
2.9.2 局部閾值化 59
2.10 總結 60
2.11 習題 60
第3章 全局特徵和區域特徵 63
3.1 視覺特徵的歷史概述 63
3.1.1 全局度量、區域度量和局部度量的核心思想 64
3.1.2 紋理分析 65
3.1.3 統計方法 68
3.2 紋理區域度量 68
3.2.1 邊緣度量 69
3.2.2 互相關性和自相關性 70
3.2.3 Fourier譜、小波和基簽名 71
3.2.4 共生矩陣、Haralick特徵 71
3.2.5 Laws紋理度量 78
3.2.6 LBP局部二值模式 79
3.2.7 動態紋理 80
3.3 統計區域度量 81
3.3.1 圖像矩特徵 81
3.3.2 點度量特徵 81
3.3.3 全局直方圖 83
3.3.4 局部區域直方圖 83
3.3.5 散點圖、3D直方圖 84
3.3.6 多解析度、多尺度直方圖 85
3.3.7 徑向直方圖 87
3.3.8 輪廓或邊緣直方圖 87
3.4 基空間度量 88
3.4.1 Fourier描述 90
3.4.2 Walsh-Hadamard變換 90
3.4.3 HAAR變換 91
3.4.4 斜變換 91
3.4.5 Zernike多項式 91
3.4.6 導向濾波器 92
3.4.7 Karhunen-Loeve變換與Hotelling變換 93
3.4.8 小波變換和Gabor濾波器 93
3.4.9 Hough變換與Radon變換 95
3.5 總結 96
3.6 習題 96
第4章 局部特徵設計 97
4.1 局部特徵 97
4.1.1 檢測器、興趣點、關鍵點、錨點和特徵點 98
4.1.2 描述子、特徵描述和特徵提取 98
4.1.3 稀疏局部模式方法 98
4.2 局部特徵屬性 99
4.2.1 選擇特徵描述子和興趣點 99
4.2.2 特徵描述子和特徵匹配 99
4.2.3 好特徵的標準 99
4.2.4 可重複性,困難和容易的查找 101
4.2.5 判別性與非判別性 101
4.2.6 相對位置和絕對位置 101
4.2.7 匹配代價和一致性 101
4.3 距離函式 102
4.3.1 距離函式的早期工作 102
4.3.2 歐氏或笛卡兒距離度量 103
4.3.3 格線距離度量 104
4.3.4 基於統計學的差異性度量 105
4.3.5 二值或布爾距離度量 106
4.4 描述子的表示 107
4.4.1 坐標空間和複合空間 107
4.4.2 笛卡兒坐標 107
4.4.3 極坐標和對數極坐標 107
4.4.4 徑向坐標 107
4.4.5 球面坐標 108
4.4.6 Gauge坐標 108
4.4.7 多元空間和多模數據 108
4.4.8 特徵金字塔 109
4.5 描述子的密度 109
4.5.1 丟棄興趣點和描述子 109
4.5.2 稠密與稀疏特徵描述 110
4.6 描述子形狀 110
4.6.1 關聯性模板 111
4.6.2 塊和形狀 111
4.6.3 對象多邊形 113
4.7 局部二值描述子與點對模式 113
4.7.1 FREAK視網膜模式 114
4.7.2 BRISK模式 115
4.7.3 ORB和BRIEF模式 116
4.8 描述子的判別性 116
4.8.1 譜的判別性 117
4.8.2 區域、形狀和模式的判別性 118
4.8.3 幾何判別因素 118
4.8.4 通過特徵可視化來評價判別性 119
4.8.5 精度與可跟蹤性 121
4.8.6 精度最佳化、子區域重疊、Gaussian加權和池化 122
4.8.7 亞像素精度 123
4.9 搜尋策略與最佳化 123
4.9.1 密集搜尋 124
4.9.2 格線搜尋 124
4.9.3 多尺度金字塔搜尋 124
4.9.4 尺度空間和圖像金字塔 125
4.9.5 特徵金字塔 126
4.9.6 稀疏預測搜尋與跟蹤 127
4.9.7 跟蹤區域限制搜尋 127
4.9.8 分割限制搜尋 127
4.9.9 深度或Z限制搜尋 127
4.10 計算機視覺、模型和結構 128
4.10.1 特徵空間 128
4.10.2 對象模型 129
4.10.3 約束 130
4.10.4 選擇檢測器和特徵 131
4.10.5 訓練概述 131
4.10.6 特徵和對象的分類 132
4.10.7 特徵學習、稀疏編碼和卷積網路 136
4.11 總結 139
4.12 習題 139
第5章 特徵描述屬性的分類 141
5.1 一般的魯棒性分類 143
5.2 一般的視覺度量分類 146
5.3 特徵度量評估 155
5.3.1 SIFT的示例 156
5.3.2 LBP的示例 156
5.3.3 形狀因子的示例 157
5.4 總結 158
5.5 習題 158
第6章 興趣點檢測與特徵描述子 159
6.1 興趣點調整 159
6.2 興趣點的概念 160
6.3 興趣點方法概述 162
6.3.1 Laplacian和LoG 163
6.3.2 Moravac角點檢測器 163
6.3.3 Harris方法、Harris-Stephens、Shi-Tomasi和Hessian類型的檢測器 163
6.3.4 Hessian矩陣檢測器和Hessian-Laplace 164
6.3.5 Gaussian差 164
6.3.6 顯著性區域 164
6.3.7 SUSAN、Trajkovic-Hedly 165
6.3.8 FAST 165
6.3.9 局部曲率方法 166
6.3.10 形態興趣區域 167
6.4 特徵描述簡介 167
6.4.1 局部二值描述子 168
6.4.2 Census 173
6.4.3 改進的Census變換 174
6.4.4 BRIEF 174
6.4.5 ORB 175
6.4.6 BRISK 176
6.4.7 FREAK 176
6.5 譜描述子 177
6.5.1 SIFT 177
6.5.2 SIFT-PCA 181
6.5.3 SIFT-GLOH 181
6.5.4 SIFT-SIFER 182
6.5.5 SIFT CS-LBP 182
6.5.6 ROOTSIFT 183
6.5.7 CenSurE和STAR 183
6.5.8 相關模板 185
6.5.9 HAAR特徵 186
6.5.10 使用類HAAR特徵的Viola和Jones算法 187
6.5.11 SURF 187
6.5.12 改進的SURF算法 189
6.5.13 梯度直方圖(HOG)及改進方法 189
6.5.14 PHOG和相關方法 190
6.5.15 Daisy和O-Daisy 191
6.5.16 CARD 193
6.5.17 具有魯棒性的快速特徵匹配 194
6.5.18 RIFF和CHOG 195
6.5.19 鏈碼直方圖 196
6.5.20 D-NETS 196
6.5.21 局部梯度模式 197
6.5.22 局部相位量化 198
6.6 基空間描述子 198
6.6.1 Fourier描述子 199
6.6.2 用其他基函式來構建描述子 200
6.6.3 稀疏編碼方法 200
6.7 多邊形形狀描述 200
6.7.1 MSER方法 201
6.7.2 針對斑點和多邊形的目標形狀度量 202
6.7.3 形狀上下文 204
6.8 3D和4D描述子 205
6.8.1 3D HOG 206
6.8.2 HON 4D 206
6.8.3 3D SIFT 207
6.9 總結 208
6.10 習題 208
第7章 基準數據、內容、度量和分析 210
7.1 基準數據 210
7.2 先前關於基準數據方面的工作:藝術與科學 212
7.2.1 質量的一般度量 212
7.2.2 算法性能的度量 212
7.2.3 Rosin關於角點方面的工作 213
7.3 構造基準數據的關鍵問題 214
7.3.1 內容:採用、修改或創建 214
7.3.2 可用的基準數據集 215
7.3.3 擬合基準數據的算法 215
7.3.4 場景構成和標註 216
7.4 定義目標和預期 218
7.4.1 Mikolajczyk和Schmid的方法 218
7.4.2 開放式評價系統 219
7.4.3 極端情況和限制 219
7.4.4 興趣點和特徵 219
7.5 基準數據的魯棒性準則 220
7.5.1 舉例說明魯棒性標準 220
7.5.2 將魯棒性標準用於實際套用 221
7.6 度量與基準數據配對 222
7.6.1 興趣點、特徵和基準數據的配對和最佳化 222
7.6.2 一般的視覺分類例子 223
7.7 合成的特徵字母表 224
7.7.1 合成數據集的目標 224
7.7.2 合成興趣點字母表 226
7.7.3 將合成字母表疊加到真實圖像上 228
7.8 總結 229
7.9 習題 230
第8章 可視流程及最佳化 231
8.1 階段、操作和資源 231
8.2 計算資源預算 233
8.2.1 計算單元、ALU和加速器 234
8.2.2 能耗的使用 235
8.2.3 記憶體的利用 235
8.2.4 I O性能 238
8.3 計算機視覺流程的實例 238
8.3.1 汽車識別 239
8.3.2 人臉檢測、情感識別和年齡識別 244
8.3.3 圖像分類 250
8.3.4 增強現實 254
8.4 可選的加速方案 258
8.4.1 記憶體最佳化 258
8.4.2 粗粒度並行 260
8.4.3 細粒度數據並行 261
8.4.4 高級指令集和加速器 263
8.5 視覺算法的最佳化與調整 263
8.5.1 編譯器最佳化與手工最佳化 264
8.5.2 特徵描述子改進、檢測器和距離函式 265
8.5.3 Boxlets與卷積加速 265
8.5.4 數據類型最佳化(整數與浮點) 265
8.6 最佳化資源 266
8.7 總結 266
第9章 特徵學習的架構分類和神經科學背景 267
9.1 計算機視覺中的神經科學思想 268
9.2 特徵生成與特徵學習 269
9.3 計算機視覺中所使用的神經科學術語 269
9.4 特徵學習的分類 274
9.4.1 卷積特徵權重學習 275
9.4.2 局部特徵描述子學習 275
9.4.3 基本特徵的組合和字典學習 275
9.4.4 特徵學習方法總結 276
9.5 計算機視覺中的機器學習模型 276
9.5.1 專家系統 277
9.5.2 統計和數學分析方法 278
9.5.3 受神經科學啟發的方法 278
9.5.4 深度學習 278
9.6 機器學習和特徵學習的歷史 280
9.6.1 歷史回顧:20世紀40年代至21世紀初 280
9.6.2 人工神經網路(ANN)分類 284
9.7 特徵學習概述 285
9.7.1 通過學習得到的各類描述子 285
9.7.2 層次特徵學習 285
9.7.3 要學習多少特徵 286
9.7.4 深度神經網路的優勢 286
9.7.5 特徵編碼的有效性 286
9.7.6 手工設計的特徵與深度學習 287
9.7.7 特徵學習的不變性和魯棒性 288
9.7.8 最好的特徵和學習架構 288
9.7.9 大數據、分析和計算機視覺的統一 289
9.7.10 關鍵技術的推動因素 291
9.8 神經科學的概念 292
9.8.1 生物學及其整體結構 293
9.8.2 難以找到統一的學習理論 294
9.8.3 人類視覺系統的架構 295
9.9 特徵學習的結構分類 299
9.9.1 架構拓撲 301
9.9.2 架構組件和層 302
9.10 總結 313
9.11 習題 313
第 10章 特徵學習和深度學習架構概述 315
10.1 架構概述 315
10.1.1 FNN架構簡介 316
10.1.2 RNN的結構簡介 372
10.1.3 BFN的結構簡介 395
10.2 集成方法 427
10.3 深度神經網路的未來 429
10.3.1 增加最大深度—深度殘差學習 429
10.3.2 使用更簡單的MLP來近似複雜模型(模型壓縮) 430
10.3.3 分類器的分解與重組 431
10.4 總結 432
10.5 習題 432
附錄A 合成特徵分析 435
附錄B 基準數據集概述 464
附錄C 成像和計算機視覺資源 470
附錄D 擴展SDM準則 474
附錄E 視覺基因組模型(VGM) 487
參考文獻 508
譯後記 541
1.3.1 方法概述 18
1.3.2 深度感知和處理中存在的問題 18
1.3.3 單目深度處理 23
1.4 三維表示:體元、深度圖、格線和點雲 26
1.5 總結 27
1.6 習題 27
第 2章 圖像預處理 29
2.1 圖像處理概述 29
2.2 圖像預處理要解決的問題 29
2.2.1 計算機視覺的流程和圖像預處理 30
2.2.2 圖像校正 31
2.2.3 圖像增強 31
2.2.4 為特徵提取準備圖像 32
2.3 圖像處理方法分類 36
2.3.1 點運算 36
2.3.2 直線運算 36
2.3.3 區域運算 37
2.3.4 算法 37
2.3.5 數據轉換 37
2.4 色彩學 37
2.4.1 色彩管理系統概述 38
2.4.2 光源、白點、黑點和中性軸 38
2.4.3 設備顏色模型 39
2.4.4 色彩空間與色彩感知 39
2.4.5 色域映射與渲染的目標 40
2.4.6 色彩增強的實際考慮 41
2.4.7 色彩的準確度與精度 41
2.5 空間濾波 41
2.5.1 卷積濾波與檢測 41
2.5.2 核濾波與形狀選擇 43
2.5.3 點濾波 44
2.5.4 噪聲與偽像濾波 45
2.5.5 積分圖與方框濾波器 46
2.6 邊緣檢測器 46
2.6.1 核集合 47
2.6.2 Canny檢測器 48
2.7 變換濾波、Fourier變換及其他 48
2.7.1 Fourier變換 48
2.7.2 其他變換 50
2.8 形態學與分割 51
2.8.1 二值形態學 51
2.8.2 灰度和彩色形態學 52
2.8.3 形態學最佳化和改進 53
2.8.4 歐氏距離映射 53
2.8.5 超像素分割 53
2.8.6 深度圖分割 54
2.8.7 色彩分割 55
2.9 閾值化 55
2.9.1 全局閾值化 56
2.9.2 局部閾值化 59
2.10 總結 60
2.11 習題 60
第3章 全局特徵和區域特徵 63
3.1 視覺特徵的歷史概述 63
3.1.1 全局度量、區域度量和局部度量的核心思想 64
3.1.2 紋理分析 65
3.1.3 統計方法 68
3.2 紋理區域度量 68
3.2.1 邊緣度量 69
3.2.2 互相關性和自相關性 70
3.2.3 Fourier譜、小波和基簽名 71
3.2.4 共生矩陣、Haralick特徵 71
3.2.5 Laws紋理度量 78
3.2.6 LBP局部二值模式 79
3.2.7 動態紋理 80
3.3 統計區域度量 81
3.3.1 圖像矩特徵 81
3.3.2 點度量特徵 81
3.3.3 全局直方圖 83
3.3.4 局部區域直方圖 83
3.3.5 散點圖、3D直方圖 84
3.3.6 多解析度、多尺度直方圖 85
3.3.7 徑向直方圖 87
3.3.8 輪廓或邊緣直方圖 87
3.4 基空間度量 88
3.4.1 Fourier描述 90
3.4.2 Walsh-Hadamard變換 90
3.4.3 HAAR變換 91
3.4.4 斜變換 91
3.4.5 Zernike多項式 91
3.4.6 導向濾波器 92
3.4.7 Karhunen-Loeve變換與Hotelling變換 93
3.4.8 小波變換和Gabor濾波器 93
3.4.9 Hough變換與Radon變換 95
3.5 總結 96
3.6 習題 96
第4章 局部特徵設計 97
4.1 局部特徵 97
4.1.1 檢測器、興趣點、關鍵點、錨點和特徵點 98
4.1.2 描述子、特徵描述和特徵提取 98
4.1.3 稀疏局部模式方法 98
4.2 局部特徵屬性 99
4.2.1 選擇特徵描述子和興趣點 99
4.2.2 特徵描述子和特徵匹配 99
4.2.3 好特徵的標準 99
4.2.4 可重複性,困難和容易的查找 101
4.2.5 判別性與非判別性 101
4.2.6 相對位置和絕對位置 101
4.2.7 匹配代價和一致性 101
4.3 距離函式 102
4.3.1 距離函式的早期工作 102
4.3.2 歐氏或笛卡兒距離度量 103
4.3.3 格線距離度量 104
4.3.4 基於統計學的差異性度量 105
4.3.5 二值或布爾距離度量 106
4.4 描述子的表示 107
4.4.1 坐標空間和複合空間 107
4.4.2 笛卡兒坐標 107
4.4.3 極坐標和對數極坐標 107
4.4.4 徑向坐標 107
4.4.5 球面坐標 108
4.4.6 Gauge坐標 108
4.4.7 多元空間和多模數據 108
4.4.8 特徵金字塔 109
4.5 描述子的密度 109
4.5.1 丟棄興趣點和描述子 109
4.5.2 稠密與稀疏特徵描述 110
4.6 描述子形狀 110
4.6.1 關聯性模板 111
4.6.2 塊和形狀 111
4.6.3 對象多邊形 113
4.7 局部二值描述子與點對模式 113
4.7.1 FREAK視網膜模式 114
4.7.2 BRISK模式 115
4.7.3 ORB和BRIEF模式 116
4.8 描述子的判別性 116
4.8.1 譜的判別性 117
4.8.2 區域、形狀和模式的判別性 118
4.8.3 幾何判別因素 118
4.8.4 通過特徵可視化來評價判別性 119
4.8.5 精度與可跟蹤性 121
4.8.6 精度最佳化、子區域重疊、Gaussian加權和池化 122
4.8.7 亞像素精度 123
4.9 搜尋策略與最佳化 123
4.9.1 密集搜尋 124
4.9.2 格線搜尋 124
4.9.3 多尺度金字塔搜尋 124
4.9.4 尺度空間和圖像金字塔 125
4.9.5 特徵金字塔 126
4.9.6 稀疏預測搜尋與跟蹤 127
4.9.7 跟蹤區域限制搜尋 127
4.9.8 分割限制搜尋 127
4.9.9 深度或Z限制搜尋 127
4.10 計算機視覺、模型和結構 128
4.10.1 特徵空間 128
4.10.2 對象模型 129
4.10.3 約束 130
4.10.4 選擇檢測器和特徵 131
4.10.5 訓練概述 131
4.10.6 特徵和對象的分類 132
4.10.7 特徵學習、稀疏編碼和卷積網路 136
4.11 總結 139
4.12 習題 139
第5章 特徵描述屬性的分類 141
5.1 一般的魯棒性分類 143
5.2 一般的視覺度量分類 146
5.3 特徵度量評估 155
5.3.1 SIFT的示例 156
5.3.2 LBP的示例 156
5.3.3 形狀因子的示例 157
5.4 總結 158
5.5 習題 158
第6章 興趣點檢測與特徵描述子 159
6.1 興趣點調整 159
6.2 興趣點的概念 160
6.3 興趣點方法概述 162
6.3.1 Laplacian和LoG 163
6.3.2 Moravac角點檢測器 163
6.3.3 Harris方法、Harris-Stephens、Shi-Tomasi和Hessian類型的檢測器 163
6.3.4 Hessian矩陣檢測器和Hessian-Laplace 164
6.3.5 Gaussian差 164
6.3.6 顯著性區域 164
6.3.7 SUSAN、Trajkovic-Hedly 165
6.3.8 FAST 165
6.3.9 局部曲率方法 166
6.3.10 形態興趣區域 167
6.4 特徵描述簡介 167
6.4.1 局部二值描述子 168
6.4.2 Census 173
6.4.3 改進的Census變換 174
6.4.4 BRIEF 174
6.4.5 ORB 175
6.4.6 BRISK 176
6.4.7 FREAK 176
6.5 譜描述子 177
6.5.1 SIFT 177
6.5.2 SIFT-PCA 181
6.5.3 SIFT-GLOH 181
6.5.4 SIFT-SIFER 182
6.5.5 SIFT CS-LBP 182
6.5.6 ROOTSIFT 183
6.5.7 CenSurE和STAR 183
6.5.8 相關模板 185
6.5.9 HAAR特徵 186
6.5.10 使用類HAAR特徵的Viola和Jones算法 187
6.5.11 SURF 187
6.5.12 改進的SURF算法 189
6.5.13 梯度直方圖(HOG)及改進方法 189
6.5.14 PHOG和相關方法 190
6.5.15 Daisy和O-Daisy 191
6.5.16 CARD 193
6.5.17 具有魯棒性的快速特徵匹配 194
6.5.18 RIFF和CHOG 195
6.5.19 鏈碼直方圖 196
6.5.20 D-NETS 196
6.5.21 局部梯度模式 197
6.5.22 局部相位量化 198
6.6 基空間描述子 198
6.6.1 Fourier描述子 199
6.6.2 用其他基函式來構建描述子 200
6.6.3 稀疏編碼方法 200
6.7 多邊形形狀描述 200
6.7.1 MSER方法 201
6.7.2 針對斑點和多邊形的目標形狀度量 202
6.7.3 形狀上下文 204
6.8 3D和4D描述子 205
6.8.1 3D HOG 206
6.8.2 HON 4D 206
6.8.3 3D SIFT 207
6.9 總結 208
6.10 習題 208
第7章 基準數據、內容、度量和分析 210
7.1 基準數據 210
7.2 先前關於基準數據方面的工作:藝術與科學 212
7.2.1 質量的一般度量 212
7.2.2 算法性能的度量 212
7.2.3 Rosin關於角點方面的工作 213
7.3 構造基準數據的關鍵問題 214
7.3.1 內容:採用、修改或創建 214
7.3.2 可用的基準數據集 215
7.3.3 擬合基準數據的算法 215
7.3.4 場景構成和標註 216
7.4 定義目標和預期 218
7.4.1 Mikolajczyk和Schmid的方法 218
7.4.2 開放式評價系統 219
7.4.3 極端情況和限制 219
7.4.4 興趣點和特徵 219
7.5 基準數據的魯棒性準則 220
7.5.1 舉例說明魯棒性標準 220
7.5.2 將魯棒性標準用於實際套用 221
7.6 度量與基準數據配對 222
7.6.1 興趣點、特徵和基準數據的配對和最佳化 222
7.6.2 一般的視覺分類例子 223
7.7 合成的特徵字母表 224
7.7.1 合成數據集的目標 224
7.7.2 合成興趣點字母表 226
7.7.3 將合成字母表疊加到真實圖像上 228
7.8 總結 229
7.9 習題 230
第8章 可視流程及最佳化 231
8.1 階段、操作和資源 231
8.2 計算資源預算 233
8.2.1 計算單元、ALU和加速器 234
8.2.2 能耗的使用 235
8.2.3 記憶體的利用 235
8.2.4 I O性能 238
8.3 計算機視覺流程的實例 238
8.3.1 汽車識別 239
8.3.2 人臉檢測、情感識別和年齡識別 244
8.3.3 圖像分類 250
8.3.4 增強現實 254
8.4 可選的加速方案 258
8.4.1 記憶體最佳化 258
8.4.2 粗粒度並行 260
8.4.3 細粒度數據並行 261
8.4.4 高級指令集和加速器 263
8.5 視覺算法的最佳化與調整 263
8.5.1 編譯器最佳化與手工最佳化 264
8.5.2 特徵描述子改進、檢測器和距離函式 265
8.5.3 Boxlets與卷積加速 265
8.5.4 數據類型最佳化(整數與浮點) 265
8.6 最佳化資源 266
8.7 總結 266
第9章 特徵學習的架構分類和神經科學背景 267
9.1 計算機視覺中的神經科學思想 268
9.2 特徵生成與特徵學習 269
9.3 計算機視覺中所使用的神經科學術語 269
9.4 特徵學習的分類 274
9.4.1 卷積特徵權重學習 275
9.4.2 局部特徵描述子學習 275
9.4.3 基本特徵的組合和字典學習 275
9.4.4 特徵學習方法總結 276
9.5 計算機視覺中的機器學習模型 276
9.5.1 專家系統 277
9.5.2 統計和數學分析方法 278
9.5.3 受神經科學啟發的方法 278
9.5.4 深度學習 278
9.6 機器學習和特徵學習的歷史 280
9.6.1 歷史回顧:20世紀40年代至21世紀初 280
9.6.2 人工神經網路(ANN)分類 284
9.7 特徵學習概述 285
9.7.1 通過學習得到的各類描述子 285
9.7.2 層次特徵學習 285
9.7.3 要學習多少特徵 286
9.7.4 深度神經網路的優勢 286
9.7.5 特徵編碼的有效性 286
9.7.6 手工設計的特徵與深度學習 287
9.7.7 特徵學習的不變性和魯棒性 288
9.7.8 最好的特徵和學習架構 288
9.7.9 大數據、分析和計算機視覺的統一 289
9.7.10 關鍵技術的推動因素 291
9.8 神經科學的概念 292
9.8.1 生物學及其整體結構 293
9.8.2 難以找到統一的學習理論 294
9.8.3 人類視覺系統的架構 295
9.9 特徵學習的結構分類 299
9.9.1 架構拓撲 301
9.9.2 架構組件和層 302
9.10 總結 313
9.11 習題 313
第 10章 特徵學習和深度學習架構概述 315
10.1 架構概述 315
10.1.1 FNN架構簡介 316
10.1.2 RNN的結構簡介 372
10.1.3 BFN的結構簡介 395
10.2 集成方法 427
10.3 深度神經網路的未來 429
10.3.1 增加最大深度—深度殘差學習 429
10.3.2 使用更簡單的MLP來近似複雜模型(模型壓縮) 430
10.3.3 分類器的分解與重組 431
10.4 總結 432
10.5 習題 432
附錄A 合成特徵分析 435
附錄B 基準數據集概述 464
附錄C 成像和計算機視覺資源 470
附錄D 擴展SDM準則 474
附錄E 視覺基因組模型(VGM) 487
參考文獻 508
譯後記 541

相關詞條

熱門詞條

聯絡我們