計算機視覺——算法與套用

計算機視覺——算法與套用

《計算機視覺——算法與套用》是2012年1月清華大學出版社出版的圖書,作者是Richard Szeliski、艾海舟

基本介紹

  • 中文名:計算機視覺——算法與套用
  • 作者:Richard Szeliski、艾海舟
  • 出版社:清華大學出版社
  • 出版時間:2012年1月
  • 定價:99 元
  • ISBN:9787302269151
內容簡介,圖書目錄,

內容簡介

《計算機視覺——算法與套用》探索了用於分析和解釋圖像的各種常用技術,描述了具有一定挑戰性的視覺套用方面的成功實例,兼顧專業的醫學成像和圖像編輯與交織之類有趣的大眾套用,以便學生能夠將其套用於自己的照片和視頻,從中獲得成就感和樂趣。本書從科學的角度介紹基本的視覺問題,將成像過程的物理模型公式化,然後在此基礎上生成對場景的逼真描述。作者還運用統計模型來分析和運用嚴格的工程方法來解決這些問題。
本書作為本科生和研究生“計算機視覺”課程的理想教材,適合計算機和電子工程專業學生使用,重點介紹現實中行之有效的基本技術,通過大量套用和練習來鼓勵學生大膽創新。此外,本書的精心設計和編排,使其可以作為計算機視覺領域中一本獨特的基礎技術參考和最新研究成果文獻。

圖書目錄

第1章 概述 1
1.1 什麼是計算機視覺? 2
1.2 簡史 8
1.3 本書概述 16
1.4 課程大綱樣例 21
1.5 標記法說明 22
1.6 擴展閱讀 22
第2章 圖像形成 25
2.1 幾何基元和變換 26
2.1.1 幾何基元 26
2.1.2 2D變換 29
2.1.3 3D變換 32
2.1.4 3D旋轉 33
2.1.5 3D到2D投影 37
2.1.6 鏡頭畸變 46
2.2 光度測定學的圖像形成 47
2.2.1 照明 48
2.2.2 反射和陰影 49
2.2.3 光學 54
2.3 數字攝像機 57
2.3.1 採樣與混疊 60
2.3.2 色彩 63
2.3.3 壓縮 71
2.4 補充閱讀 72
2.5 習題 73
第3章 圖像處理 77
3.1 點運算元 78
3.1.1 像素變換 79
3.1.2 彩色變換 81
3.1.3 合成與摳圖 81
3.1.5 套用:色調調整 86
3.2 線性濾波 86
3.2.1 可分離的濾波 89
3.2.2 線性濾波示例 90
3.2.3 帶通和導向濾波器 91
3.3 更多的鄰域運算元 95
3.3.2 形態學 99
3.3.3 距離變換 100
3.3.4 連通量 101
3.4 傅立葉變換 102
3.4.1 傅立葉變換對 105
3.4.2 二維傅立葉變換 107
3.4.3 維納濾波 108
3.4.4 套用:銳化,模糊
和去噪 111
3.5 金字塔與小波 111
3.5.1 插值 112
3.5.2 降採樣 114
3.5.3 多解析度表達 116
3.5.4 小波 119
3.5.5 套用:圖像融合 123
3.6 幾何變換 125
3.6.1 參數化變換 125
3.6.2 基於格線的卷繞 131
3.6.3 套用:基於特徵的變形 133
3.7 全局最佳化 133
3.7.1 正則化 134
3.7.2 馬爾科夫隨機場 138
3.7.3 套用:圖像的恢復 147
3.8 補充閱讀 147
3.9 習題 149
第4章 特徵檢測與匹配 157
4.1 點和塊 159
4.1.1 特徵檢測器 160
4.1.2 特徵描述子 169
4.1.3 特徵匹配 172
4.1.4 特徵跟蹤 179
4.1.5 套用:表演驅動的動畫 181
4.2 邊緣 182
4.2.1 邊緣檢測 182
4.2.2 邊緣連線 187
4.2.3 套用:邊緣編輯和增強 189
4.3 線條 190
4.3.1 逐次近似 191
4.3.2 Hough變換 191
4.3.3 消失點 194
4.3.4 套用:矩形檢測 196
4.4 擴展閱讀 197
4.5 習題 198
第5章 分割 205
5.1 活動輪廓 206
5.1.1 蛇行 207
5.1.2 動態蛇行和
CONDENSATION 211
5.1.3 剪刀 214
5.1.4 水平集 215
5.1.5 套用:輪廓跟蹤和
轉描機 217
5.2 分裂與歸併 218
5.2.1 分水嶺 218
5.2.2 區域分裂(區分式聚類) 219
5.2.3 區域歸併(凝聚式聚類) 219
5.2.4 基於圖的分割 219
5.2.5 機率聚集 220
5.3 均值移位和模態發現 221
5.3.1 k-均值和高斯混合 222
5.3.2 均值移位 224
5.4 規範圖割 227
5.5 圖割和基於能量的方法 230
5.6 補充閱讀 234
5.7 習題 235
第6章 基於特徵的配準 237
6.1 基於2D和3D特徵的配準 238
6.1.1 使用最小二乘的
2D配準 238
6.1.2 套用:全景圖 240
6.1.3 疊代算法 241
6.1.4 魯棒最小二乘
和RANSAC 243
6.1.5 3D配準 245
6.2 姿態估計 246
6.2.1 線性算法 246
6.2.2 疊代算法 248
6.2.3 套用:增強現實 249
6.3 幾何內參數標定 250
6.3.1 標定模式 250
6.3.2 消失點 252
6.3.3 套用:單視圖測量學 253
6.3.4 旋轉運動 254
6.3.5 徑向畸變 256
6.4 補充閱讀 257
6.5 習題 258
第7章 由運動到結構 263
7.1 三角測量 264
7.2 二視圖由運動到結構 266
7.2.1 投影(未標定的)重建 270
7.2.2 自標定 271
7.2.3 套用:視圖變形 273
7.3 因子分解 274
7.3.1 透視與投影因子分解 276
7.3.2 套用:稀疏3D模型
提取 277
7.4 光束平差法 278
7.4.1 挖掘稀疏性 280
7.4.2 套用:匹配運動和增強
現實 282
7.4.3 不確定性和二義性 283
7.4.4 套用:由網際網路照片
重建 284
7.5 限定結構和運動 287
7.5.1 基於線條的方法 287
7.5.2 基於平面的方法 288
7.6 補充閱讀 289
7.7 習題 290
第8章 稠密運動估計 293
8.1 平移配準 294
8.1.1 分層運動估計 297
8.1.2 基於傅立葉的配準 298
8.1.3 逐次求精 300
8.2 參數化運動 305
8.2.1 套用:視頻穩定化 308
8.2.2 學到的運動模型 308
8.3 基於樣條的運動 309
8.4 光流 312
8.4.1 多幀運動估計 315
8.4.2 套用:視頻去噪 316
8.4.3 套用:去隔行掃描 316
8.5 層次運動 317
8.5.1 套用:幀插值 319
8.5.2 透明層和反射 320
8.6 補充閱讀 321
8.7 習題 322
第9章 圖像拼接 327
9.1 運動模型 329
9.1.1 平面透視運動 329
9.1.2 套用:白板和文檔掃描 330
9.1.3 旋轉全景圖 331
9.1.4 縫隙消除 333
9.1.5 套用:視頻摘要和壓縮 334
9.1.6 圓柱面和球面坐標 335
9.2 全局配準 338
9.2.1 光束平差法 338
9.2.2 視差消除 341
9.2.3 認出全景圖 343
9.2.4 直接配準和基於特徵的
?配準 345
9.3 合成 346
9.3.1 合成表面的選擇 346
9.3.2 像素選擇和加權
(去虛影) 348
9.3.3 套用:照片蒙太奇 352
9.3.4 融合 353
9.4 補充閱讀 355
9.5 習題 356
第10章 計算攝影學 359
10.1 光度學標定 361
10.1.1 輻射度回響函式 362
10.1.2 噪聲水平估計 363
10.1.3 虛影 364
10.1.4 光學模糊(空間回響)
估計 365
10.2.1 色調映射 374
10.2.2 套用:閃影術 380
10.3 超解析度和模糊去除 381
10.3.1 彩色圖像去馬賽克 385
10.3.2 套用:彩色化 387
10.4 圖像摳圖和合成 388
10.4.1 藍屏摳圖 389
10.4.2 自然圖像摳圖 391
10.4.3 基於最佳化的摳圖 394
10.4.4 煙、陰影和閃摳圖 396
10.4.5 視頻摳圖 397
10.5 紋理分析與合成 398
10.5.1 套用:空洞填充
與修圖 400
10.5.2 套用:非真實感繪製 401
10.6 補充閱讀 403
10.7 習題 404
第11章 立體視覺對應 409
11.1 極線幾何學 412
11.1.1 矯正 412
11.1.2 平面掃描 414
11.2 稀疏對應 416
11.3 稠密對應 418
11.4 局部方法 420
11.4.1 亞像素估計
與不確定性 422
11.4.2 套用:基於立體視覺的
頭部跟蹤 423
11.5 全局最佳化 424
11.5.1 動態規劃 425
11.5.2 基於分割的方法 427
11.5.3 套用:z-鍵控與背景
替換 428
11.6 多視圖立體視覺 429
11.6.1 體積與3D表面重建 432
11.6.2 由輪廓到形狀 436
11.7 補充閱讀 438
11.8 習題 439
第12章 3D重建 443
12.1 由X到形狀 444
12.1.1 由陰影到形狀與光度
測量立體視覺 445
12.1.2 由紋理到形狀 447
12.1.3 由聚焦到形狀 448
12.2 主動距離獲取 449
12.2.1 距離數據歸併 451
12.2.2 套用:數字遺產 453
12.3 表面表達 454
12.3.1 表面插值 454
12.3.2 表面簡化 455
12.3.3 幾何圖像 456
12.4 基於點的表達 456
12.5 體積表達 457
12.6 基於模型的重建 459
12.6.1 建築結構 459
12.6.2 頭部和人臉 461
12.6.3 套用:臉部動畫 463
12.6.4 完整人體建模與跟蹤 465
12.7 恢復紋理映射與反照率 469
12.7.1 估計BRDF 470
12.7.2 套用:3D攝影學 471
12.8 補充閱讀 472
12.9 習題 473
第13章 基於圖像的繪製 477
13.1 視圖插值 478
13.1.1 視圖相關的紋理映射 480
13.1.2 套用:照片遊覽 481
13.2 層次深度圖像 482
13.3 光場與發光圖 484
13.3.1 非結構化發光圖 487
13.3.2 表面光場 488
13.3.3 套用:同心拼圖 489
13.4 環境影像形板 490
13.4.1 更高維光場 491
13.4.2 從建模到繪製 492
13.5 基於視頻的繪製 493
13.5.1 基於視頻的動畫 493
13.5.2 視頻紋理 494
13.5.3 套用:圖片動畫 497
13.5.4 3D視頻 497
13.5.5 套用:基於視頻的
遊覽 499
13.6 補充閱讀 501
13.7 習題 503
第14章 識別 507
14.1 物體檢測 509
14.1.1 人臉檢測 509
14.1.2 行人檢測 515
14.2 人臉識別 518
14.2.1 特徵臉 518
14.2.2 活動表觀與3D形狀
模型 525
14.2.3 套用:個人照片收藏 528
14.3 實例識別 529
14.3.1 幾何配準 530
14.3.2 大型資料庫 531
14.3.3 套用:位置識別 535
14.4 類別識別 537
14.4.1 詞袋 539
14.4.2 基於部件的模型 542
14.4.3 基於分割的識別 545
14.4.4 套用:智慧型照片編輯 548
14.5 上下文與場景理解 550
14.5.1 學習與大型圖像收集 552
14.5.2 套用:圖像搜尋 554
14.6 識別資料庫和測試集 555
14.7 補充閱讀 559
14.8 習題 562
第15章 結語 567
附錄A 線性代數與數值方法 569
A.1 矩陣分解 570
A.1.1 奇異值分解 570
A.1.2 特徵值分解 571
A.1.3 QR因子分解 573
A.1.4 喬里斯基分解 574
A.2 線性最小二乘 575
A.3 非線性最小二乘 578
A.4 直接稀疏矩陣方法 579
A.5 疊代方法 580
A.5.1 共軛梯度 581
A.5.2 預處理 582
A.5.3 多重格線 583
附錄B 貝葉斯建模與推斷 585
B.1 估計理論 586
B.2 最大似然估計與最小二乘 589
B.3 魯棒統計學 590
B.4 先驗模型與貝葉斯推斷 591
B.5 馬爾科夫隨機場 592
B.5.1 梯度下降與模擬退火 594
B.5.2 動態規劃 595
B.5.3 置信傳播 596
B.5.4 圖割 598
B.5.5 線性規劃 601
B.6 不確定性估計(誤差分析) 602
附錄C 補充材料 604
C.1 數據集 605
C.2 軟體 607
C.3 幻燈片與講座 615
C.4 參考文獻 615
辭彙表 617

相關詞條

熱門詞條

聯絡我們