圖像分析是指用模式識別和人工智慧方法對景物進行分析、描述、分類和解釋,又稱景物分析或圖像理解。視頻分析是指使用圖像分析技術,通過將場景中的背景和目標分離進而分析並追蹤在攝像機場景內出現的目標。《複雜場景下圖像與視頻分析》從基本概念入手,系統地介紹了圖像和視頻分析的基本理論,包括圖像與視頻分割、特徵提取與描述、分類器設計等,並結合理論重點介紹了文檔圖像版面分析、場景分類、運動目標檢測和跟蹤3個套用實例。全書突出了理論和實踐相結合的特點。 《複雜場景下圖像與視頻分析》可作為高校計算機科學、電子工程、自動化、生物醫學、遙感、地質、礦業、通信、氣象、農業等相關專業研究生和高年級本科生教材,也可供相關領域的大學教師、科研人員和工程技術人員參考。
基本介紹
- 書名:複雜場景下圖像與視頻分析
- 作者:龔聲蓉 劉純平
- 出版社:人民郵電出版社
- 頁數:408頁
- 開本:16
- 品牌:人民郵電出版社
- 外文名:Image and Video Analysis in Complex Scenes
- 類型:科技
- 出版日期:2013年9月1日
- 語種:簡體中文
- ISBN:9787115322395
基本介紹
內容簡介
通俗易懂、案例豐富。將加入大量案例,採用通俗的語言、循序漸進、由淺入深地講述基本原理及其實現方法,便於閱讀。
提供的資源豐富。書中提供主要開發工具、常用的實驗素材連結以及重要的國際會議及期刊、研究機構和學者以及相關論壇等極大地方便學生自主學習。
作者簡介
劉純平,女,博士,副教授、碩士生導師。2002年畢業於南京理工大學計算機學院,獲模式識別與智慧型控制專業博士學位。2010年7月到2011年9月中佛羅里達大學計算機視覺實驗室作訪問學者。近年來,主持和參與國家及省級科研課題10項,發表文章60多篇。目前主要研究方向為圖像與視頻處理、計算機視覺、模式識別等。
季怡,女,1973年生,博士。1996年畢業於南京大學計算機科學與技術學院計算機軟體專業。2003年和2010年在新加坡國立大學和法國國立里昂套用技術學院獲得碩士和博士學位。主要研究方向為計算機視覺、模式識別、圖像及視頻內容分析等,已在著名國際學術會議ICPR、ICIP、IEEE Multimedia和Pattern Recognition Letters等期刊發表學術論文多篇。
圖書目錄
1.1 視覺感知與彩色模型 1
1.1.1 視覺感知 1
1.1.2 彩色模型 3
1.2 圖像和視頻的數位化 8
1.2.1 圖像的數位化 8
1.2.2 視頻的數位化 10
1.3 圖像和視頻分析的相關概念 10
1.3.1 數字圖像處理 10
1.3.2 圖像分析 11
1.3.3 視頻分析 12
1.4 圖像與視頻分析的研究內容 13
1.4.1 圖像與視頻場景分割 13
1.4.2 圖像與視頻場景特徵描述 14
1.4.3 圖像/視頻中的目標識別 15
1.4.4 場景描述與理解 16
1.5 圖像與視頻分析的套用 17
1.5.1 工業方面的套用 17
1.5.2 醫學圖像分析 18
1.5.3 遙感領域套用 18
1.5.4 軍事公安領域的套用 19
1.5.5 交通 20
1.5.6 其他 21
1.6 小結 22
參考文獻 22
第2章 圖像分割技術 24
2.1 圖像與視頻分割概述 24
2.2 幾種經典圖像分割方法 25
2.2.1 基於邊緣的分割 25
2.2.2 基於閾值的分割 32
2.2.3 基於區域的分割 37
2.3 基於形態學分水嶺的分割 39
2.3.1 形態學圖像處理基本概念和運算 39
2.3.2 基於分水嶺的分割 43
2.4 基於聚類的分割 46
2.4.1 C—均值聚類方法 46
2.4.2 模糊C—均值聚類方法 47
2.5 基於圖論的圖像分割方法 49
2.5.1 基本原理 49
2.5.2 GraphCut及其改進圖像分割方法 50
2.5.3 其他基於圖的分割方法 55
2.6 偏微分圖像分割 56
2.6.1 Snakes及其改進模型 57
2.6.2 水平集(LevelSet)方法 58
2.6.3 基於變分水平集的圖像分割 62
2.7 多特徵融合的圖像分割 63
2.8 彩色圖像分割 64
2.8.1 直方圖閾值法 64
2.8.2 彩色空間聚類法 65
2.8.3 融合顏色和空間信息的彩色圖像分割 66
2.9 視頻對象分割 68
2.9.1 基於時空的視頻對象分割 68
2.9.2 基於運動的視頻對象分割 71
2.9.3 互動式視頻對象分割 79
2.9.4 基於高斯混合模型的自適應陰影檢測 79
2.10 小結 82
參考文獻 82
第3章 特徵描述與提取 86
3.1 概述 86
3.1.1 視覺特徵 87
3.1.2 圖像內容 87
3.1.3 圖像特徵 87
3.1.4 圖像特徵提取 89
3.1.5 特徵選擇 89
3.2 常用的低層視覺特徵 90
3.2.1 顏色特徵描述 91
3.2.2 紋理特徵描述 96
3.2.3 形狀特徵描述 127
3.2.4 局部特徵描述 150
3.2.5 視覺特徵的比較 182
3.3 其他低層特徵提取 183
3.3.1 圖像代數特徵 183
3.3.2 圖像變換係數特徵 184
3.3.3 基於統計信息的特徵提取 184
3.4 圖像中層語義描述 185
3.4.1 視覺詞包(Bag—of—Visterms,BOV) 185
3.4.2 語義主題 188
3.5 圖像高層語義特徵描述 189
3.5.1 語義提取模型 190
3.5.2 語義關聯 192
3.5.3 高層語義描述推理 193
3.6 運動特徵描述 199
3.6.1 基於MPEG—7的運動特徵描述 201
3.6.2 非參數模型 202
3.6.3 參數模型 206
3.6.4 基於特徵的運動估計 210
3.7 小結 210
參考文獻 211
第4章 分類器設計 218
4.1 概述 218
4.1.1 生成模型 218
4.1.2 判別模型 220
4.1.3 混合生成—判別模型 221
4.2 常見分類器 222
4.2.1 貝葉斯分類器 222
4.2.2 SVM分類器 228
4.2.3 強化學習分類器 235
4.2.4 神經網路分類器 250
4.2.5 基於點集Voronoi圖的分類器 256
4.2.6 最近鄰凸包分類器 258
4.2.7 遺傳算法和免疫算法的分類器 262
4.2.8 基於稀疏表示的分類器 265
4.3 多分類器集成 267
4.3.1 集成學習的有效性和條件 268
4.3.2 基分類器產生方法 269
4.3.3 多分類器集成系統結構 270
4.3.4 多分類器設計方法 272
4.3.5 分類器的選擇準則 273
4.3.6 Adaboost分類器 274
4.4 小結 279
參考文獻 280
第5章 基於SVM的文檔圖像版面分析 286
5.1 概述 286
5.1.1 版面分析發展歷程 286
5.1.2 版面分析方法分類 288
5.2 文檔圖像傾斜檢測 290
5.2.1 傾斜校正方法概述 290
5.2.2 改進的最近鄰鏈傾斜檢測算法 292
5.3 簡單背景下版面分割 298
5.3.1 基於邊緣檢測的連通區構造 298
5.3.2 結合連通區和遊程平滑版面分割 299
5.3.3 文本區域二值化 303
5.4 複雜背景下版面分割 304
5.5 閱讀順序未知的純文本圖像版面分析 306
5.5.1 已有算法分析 307
5.5.2 基於SVM的複雜純文本圖像版面分析算法 308
5.6 小結 312
參考文獻 312
第6章 基於顯著性和LDA主題模型的圖像場景分類 315
6.1 基於語義生成模型的圖像場景分類概述 315
6.2 基本術語 317
6.3 圖像中的主題模型 318
6.4 基於主題模型的場景分類方法基本框架 319
6.5 基於顯著性的主題模型場景分類 319
6.5.1 視覺詞包表示 320
6.5.2 視覺詞包生成 321
6.5.3 基於頻域顯著性的視覺詞包生成 322
6.5.4 統計可視單詞的詞頻表 327
6.5.5 改進LDA模型在圖像上的實現 327
6.6 本章小結 340
參考文獻 340
第7章 運動目標檢測與跟蹤 342
7.1 概述 342
7.2 基於背景差分的目標檢測 345
7.2.1 背景建模概述 345
7.2.2 單高斯背景建模 347
7.2.3 高斯混合背景建模 347
7.2.4 引入二型模糊的混合高斯背景建模 351
7.3 非參數核密度估計的運動目標檢測 356
7.3.1 經典方法 357
7.3.2 基於時間窗的核密度估計運動檢測 358
7.3.3 聚類差分核密度估計算法 363
7.4 檢測結果後處理 366
7.5 運動目標跟蹤 367
7.5.1 Kalman預測與全局特徵匹配跟蹤 368
7.5.2 基於MeanShift的目標跟蹤 373
7.5.3 改進的MeanShift跟蹤方法 377
7.5.4 基於粒子濾波的跟蹤 378
7.5.5 抗遮擋目標跟蹤 385
7.5.6 基於角點抽樣的互遮擋多目標跟蹤 392
7.6 小結 399
參考文獻 399
名詞索引 404