《複雜場景下圖像與視頻分析》是2013年人民郵電出版社出版的圖書,作者是龔聲蓉、劉純平。
基本介紹
- 中文名:複雜場景下圖像與視頻分析
- 外文名:Image and Video Analysis in Complex Scenes
- 作者:龔聲蓉、劉純平
- 出版社:人民郵電出版社
- 頁數:408 頁
- 開本:16 開
- 品牌:人民郵電出版社
- 類型:科技
- 出版日期:2013年9月1日
- 語種:簡體中文
- ISBN:9787115322395
內容簡介,作者簡介,圖書目錄,
內容簡介
理論與實踐結合。
通俗易懂、案例豐富。將加入大量案例,採用通俗的語言、循序漸進、由淺入深地講述基本原理及其實現方法,便於閱讀。
提供的資源豐富。書中提供主要開發工具、常用的實驗素材連結以及重要的國際會議及期刊、研究機構和學者以及相關論壇等極大地方便學生自主學習。
作者簡介
龔聲蓉,男,1966年生,博士,教授、博士生導師。1987年畢業於東北石油大學計算機軟體與理論專業;1993年畢業於哈爾濱工業大學,獲計算機套用技術碩士學位;2001年畢業於北京航空航天大學,獲計算機套用技術博士學位。現為中國計算機學會高級會員、中國圖像圖形學會虛擬現實專業委員會委員、中國通信學會雲計算專家委員會委員,曾任2010—2011年度YOCSEF蘇州分論壇學術委員會主席。主持和參與國家及省部級科研課題20多項,獲部級科技進步獎2項,市(廳)級科技進步獎6項,發表學術論文90多篇。獲省部級教學獎7項,主編國家“十一五”規劃教材《多媒體技術套用》、《數字圖像處理與分析》2部,其中《多媒體技術套用》獲評江蘇省精品教材。目前研究方向為圖像與視頻處理、計算機視覺、模式識別等。
劉純平,女,博士,副教授、碩士生導師。2002年畢業於南京理工大學計算機學院,獲模式識別與智慧型控制專業博士學位。2010年7月到2011年9月中佛羅里達大學計算機視覺實驗室作訪問學者。近年來,主持和參與國家及省級科研課題10項,發表文章60多篇。目前主要研究方向為圖像與視頻處理、計算機視覺、模式識別等。
季怡,女,1973年生,博士。1996年畢業於南京大學計算機科學與技術學院計算機軟體專業。2003年和2010年在新加坡國立大學和法國國立里昂套用技術學院獲得碩士和博士學位。主要研究方向為計算機視覺、模式識別、圖像及視頻內容分析等,已在著名國際學術會議ICPR、ICIP、IEEE Multimedia和Pattern Recognition Letters等期刊發表學術論文多篇。
圖書目錄
第1章 緒論 1
1.1 視覺感知與彩色模型 1
1.1.1 視覺感知 1
1.1.2 彩色模型 3
1.2 圖像和視頻的數位化 8
1.2.1 圖像的數位化 8
1.2.2 視頻的數位化 10
1.3 圖像和視頻分析的相關概念 10
1.3.1 數字圖像處理 10
1.3.2 圖像分析 11
1.3.3 視頻分析 12
1.4 圖像與視頻分析的研究內容 13
1.4.1 圖像與視頻場景分割 13
1.4.2 圖像與視頻場景特徵描述 14
1.4.3 圖像/視頻中的目標識別 15
1.4.4 場景描述與理解 16
1.5 圖像與視頻分析的套用 17
1.5.1 工業方面的套用 17
1.5.2 醫學圖像分析 18
1.5.3 遙感領域套用 18
1.5.4 軍事公安領域的套用 19
1.5.5 交通 20
1.5.6 其他 21
1.6 小結 22
參考文獻 22
第2章 圖像分割技術 24
2.1 圖像與視頻分割概述 24
2.2 幾種經典圖像分割方法 25
2.2.1 基於邊緣的分割 25
2.2.2 基於閾值的分割 32
2.2.3 基於區域的分割 37
2.3 基於形態學分水嶺的分割 39
2.3.1 形態學圖像處理基本概念和運算 39
2.3.2 基於分水嶺的分割 43
2.4 基於聚類的分割 46
2.4.1 C—均值聚類方法 46
2.4.2 模糊C—均值聚類方法 47
2.5 基於圖論的圖像分割方法 49
2.5.1 基本原理 49
2.5.2 GraphCut及其改進圖像分割方法 50
2.5.3 其他基於圖的分割方法 55
2.6 偏微分圖像分割 56
2.6.1 Snakes及其改進模型 57
2.6.2 水平集(LevelSet)方法 58
2.6.3 基於變分水平集的圖像分割 62
2.7 多特徵融合的圖像分割 63
2.8 彩色圖像分割 64
2.8.1 直方圖閾值法 64
2.8.2 彩色空間聚類法 65
2.8.3 融合顏色和空間信息的彩色圖像分割 66
2.9 視頻對象分割 68
2.9.1 基於時空的視頻對象分割 68
2.9.2 基於運動的視頻對象分割 71
2.9.3 互動式視頻對象分割 79
2.9.4 基於高斯混合模型的自適應陰影檢測 79
2.10 小結 82
參考文獻 82
第3章 特徵描述與提取 86
3.1 概述 86
3.1.1 視覺特徵 87
3.1.2 圖像內容 87
3.1.3 圖像特徵 87
3.1.4 圖像特徵提取 89
3.1.5 特徵選擇 89
3.2 常用的低層視覺特徵 90
3.2.1 顏色特徵描述 91
3.2.2 紋理特徵描述 96
3.2.3 形狀特徵描述 127
3.2.4 局部特徵描述 150
3.2.5 視覺特徵的比較 182
3.3 其他低層特徵提取 183
3.3.1 圖像代數特徵 183
3.3.2 圖像變換係數特徵 184
3.3.3 基於統計信息的特徵提取 184
3.4 圖像中層語義描述 185
3.4.1 視覺詞包(Bag—of—Visterms,BOV) 185
3.4.2 語義主題 188
3.5 圖像高層語義特徵描述 189
3.5.1 語義提取模型 190
3.5.2 語義關聯 192
3.5.3 高層語義描述推理 193
3.6 運動特徵描述 199
3.6.1 基於MPEG—7的運動特徵描述 201
3.6.2 非參數模型 202
3.6.3 參數模型 206
3.6.4 基於特徵的運動估計 210
3.7 小結 210
參考文獻 211
第4章 分類器設計 218
4.1 概述 218
4.1.1 生成模型 218
4.1.2 判別模型 220
4.1.3 混合生成—判別模型 221
4.2 常見分類器 222
4.2.1 貝葉斯分類器 222
4.2.2 SVM分類器 228
4.2.3 強化學習分類器 235
4.2.4 神經網路分類器 250
4.2.5 基於點集Voronoi圖的分類器 256
4.2.6 最近鄰凸包分類器 258
4.2.7 遺傳算法和免疫算法的分類器 262
4.2.8 基於稀疏表示的分類器 265
4.3 多分類器集成 267
4.3.1 集成學習的有效性和條件 268
4.3.2 基分類器產生方法 269
4.3.3 多分類器集成系統結構 270
4.3.4 多分類器設計方法 272
4.3.5 分類器的選擇準則 273
4.3.6 Adaboost分類器 274
4.4 小結 279
參考文獻 280
第5章 基於SVM的文檔圖像版面分析 286
5.1 概述 286
5.1.1 版面分析發展歷程 286
5.1.2 版面分析方法分類 288
5.2 文檔圖像傾斜檢測 290
5.2.1 傾斜校正方法概述 290
5.2.2 改進的最近鄰鏈傾斜檢測算法 292
5.3 簡單背景下版面分割 298
5.3.1 基於邊緣檢測的連通區構造 298
5.3.2 結合連通區和遊程平滑版面分割 299
5.3.3 文本區域二值化 303
5.4 複雜背景下版面分割 304
5.5 閱讀順序未知的純文本圖像版面分析 306
5.5.1 已有算法分析 307
5.5.2 基於SVM的複雜純文本圖像版面分析算法 308
5.6 小結 312
參考文獻 312
第6章 基於顯著性和LDA主題模型的圖像場景分類 315
6.1 基於語義生成模型的圖像場景分類概述 315
6.2 基本術語 317
6.3 圖像中的主題模型 318
6.4 基於主題模型的場景分類方法基本框架 319
6.5 基於顯著性的主題模型場景分類 319
6.5.1 視覺詞包表示 320
6.5.2 視覺詞包生成 321
6.5.3 基於頻域顯著性的視覺詞包生成 322
6.5.4 統計可視單詞的詞頻表 327
6.5.5 改進LDA模型在圖像上的實現 327
6.6 本章小結 340
參考文獻 340
第7章 運動目標檢測與跟蹤 342
7.1 概述 342
7.2 基於背景差分的目標檢測 345
7.2.1 背景建模概述 345
7.2.2 單高斯背景建模 347
7.2.3 高斯混合背景建模 347
7.2.4 引入二型模糊的混合高斯背景建模 351
7.3 非參數核密度估計的運動目標檢測 356
7.3.1 經典方法 357
7.3.2 基於時間窗的核密度估計運動檢測 358
7.3.3 聚類差分核密度估計算法 363
7.4 檢測結果後處理 366
7.5 運動目標跟蹤 367
7.5.1 Kalman預測與全局特徵匹配跟蹤 368
7.5.2 基於MeanShift的目標跟蹤 373
7.5.3 改進的MeanShift跟蹤方法 377
7.5.4 基於粒子濾波的跟蹤 378
7.5.5 抗遮擋目標跟蹤 385
7.5.6 基於角點抽樣的互遮擋多目標跟蹤 392
7.6 小結 399
參考文獻 399
名詞索引 404