本書深入淺出地介紹了多媒體信息處理領域的基本概念、基本原理、關鍵技術和典型套用。全書共10章,主要包括多媒體信息處理基礎、圖像增強、形態學圖像處理、圖像分割、數字圖像與視頻壓縮編碼原理及相關標準、數字音頻編碼技術及標準、數字媒體檔案格式、數字水印技術、基於內容的多媒體信息檢索等內容。每章都附有小結與習題,以指導讀者加深對本書主要內容的理解。 本書取材精選,內容新穎,條理清晰,通俗易懂,重點突出,注重實用。在強調基本概念、基本原理的同時,注重理論與實際套用相結合,介紹了相關領域的最新研究成果及發展新動向。 本書既可作為高等院校電子信息工程、通信工程、電子科學與技術、計算機套用、廣播電視工程等專業的高年級本科生或研究生的教材或教學參考書,也可供從事多媒體信息處理技術領域工作的研究與開發人員參考。
基本介紹
- 書名:21世紀高等院校信息與通信工程
- 作者:盧官明 焦良葆
- 出版日期:2011年10月1日
- 語種:簡體中文
- ISBN:9787115260642
- 品牌:人民郵電出版社
- 外文名:Multimedia Information Proce
- 出版社:人民郵電出版社
- 頁數:316頁
- 開本:16
- 定價:39.80
內容簡介
圖書目錄
第1章 多媒體信息處理基礎 1
1.1 多媒體的基本概念 1
1.1.1 媒體的概念 1
1.1.2 多媒體與多媒體技術 4
1.2 音頻信息處理基礎 4
1.2.1 聲音的基本特性 5
1.2.2 聲音的主觀感覺 6
1.2.3 音頻信號的數位化 9
1.3 圖像信息處理基礎 11
1.3.1 光的顏色與彩色三要素 11
1.3.2 三基色原理 12
1.3.3 幾種典型的顏色空間模型及轉換關係 14
1.3.4 圖像信號的數位化 18
1.4 視頻信號的數位化 23
1.5 MATLAB在圖像處理中的套用 25
1.5.1 MATLAB簡介 25
1.5.2 MATLAB中圖像檔案的基本操作 25
1.5.3 MATLAB編程實例 27
1.6 小結 29
習題 29
第2章 圖像增強 30
2.1 引言 30
2.2 圖像的灰度變換 31
2.2.1 灰度的線性變換 31
2.2.2 灰度的非線性變換 34
2.2.3 直方圖修正 34
2.2.4 直方圖規定化 41
2.3 圖像平滑 44
2.3.1 模板操作和卷積運算 44
2.3.2 鄰域平均法 46
2.3.3 中值濾波 48
2.3.4 頻率域低通濾波 50
2.4 圖像銳化 53
2.4.1 梯度運算(運算元) 54
2.4.2 索貝爾(Sobel)運算元 55
2.4.3 拉普拉斯(Laplacian)運算元 56
2.4.4 頻率域高通濾波 58
2.5 圖像的同態濾波 61
2.6 彩色增強 62
2.6.1 偽彩色增強 62
2.6.2 假彩色增強 64
2.7 MATLAB編程實例 65
2.8 小結 67
習題 68
第3章 形態學圖像處理 69
3.1 引言 69
3.1.1 數學形態學的發展簡史和基本思想 69
3.1.2 集合論基礎 70
3.1.3 數學形態學中的幾個基本概念 72
3.2 二值形態學基本運算 74
3.2.1 腐蝕 74
3.2.2 膨脹 75
3.2.3 腐蝕運算與膨脹運算的對偶性 76
3.2.4 開運算 77
3.2.5 閉運算 78
3.3 二值圖像的形態學處理 79
3.3.1 邊緣提取 79
3.3.2 區域填充 79
3.3.3 骨架抽取 81
3.3.4 細化 82
3.3.5 粗化 83
3.3.6 形態濾波 84
3.4 灰度形態學基本運算 85
3.4.1 灰度腐蝕 85
3.4.2 灰度膨脹 87
3.4.3 灰度開運算與閉運算 88
3.5 灰度圖像的形態學處理 90
3.5.1 形態學梯度 90
3.5.2 形態學平滑濾波 91
3.5.3 高帽(Top-hat)變換 91
3.6 MATLAB編程實例 91
3.6.1 MATLAB中形態學基本運算函式 91
3.6.2 MATLAB編程實例 94
3.7 小結 96
習題 97
第4章 圖像分割 98
4.1 圖像分割的概念及分類 98
4.1.1 圖像分割的概念 98
4.1.2 圖像分割的依據和方法分類 99
4.2 基於灰度閾值化的圖像分割 100
4.2.1 閾值化分割的原理 100
4.2.2 全局閾值化分割法 101
4.2.3 局部閾值化分割法 103
4.3 基於邊緣檢測的圖像分割 103
4.3.1 邊緣檢測的基本原理和步驟 104
4.3.2 梯度運算元 105
4.3.3 Laplacian運算元和LoG運算元 107
4.3.4 Canny運算元 109
4.3.5 邊緣跟蹤 112
4.4 基於區域的圖像分割 114
4.4.1 區域生長法 114
4.4.2 區域分裂與合併法 116
4.5 MATLAB編程實例 117
4.6 小結 122
習題 123
第5章 數字圖像與視頻壓縮編碼原理 124
5.1 數字圖像與視頻壓縮編碼概述 124
5.1.1 數字圖像與視頻壓縮的必要性和可能性 124
5.1.2 數字圖像與視頻壓縮編碼的主要方法及其分類 126
5.2 無失真編碼 128
5.2.1 遊程編碼 128
5.2.2 霍夫曼編碼 128
5.2.3 算術編碼 129
5.3 預測編碼 134
5.3.1 圖像差值信號的統計特性 135
5.3.2 幀內預測編碼 136
5.3.3 幀間預測編碼 137
5.4 變換編碼 142
5.4.1 圖像的頻率域統計特性 142
5.4.2 變換編碼的基本原理 142
5.4.3 正交變換基的選擇 143
5.4.4 DCT圖像編碼 144
5.5 MATLAB編程實例 147
5.6 小結 149
習題 150
第6章 數字圖像與視頻壓縮編碼標準 151
6.1 靜止圖像編碼標準 151
6.1.1 JPEG標準概述 151
6.1.2 JPEG基本編碼系統 152
6.1.3 基於DCT的漸進編碼 153
6.1.4 分級編碼 154
6.1.5 JPEG 2000標準概述 154
6.1.6 JPEG 2000標準的基本框架 154
6.1.7 JPEG 2000的主要特點 155
6.2 數字視頻編碼的標準化進程 157
6.3 MPEG-1/MPEG-2視頻編碼標準 159
6.3.1 I幀、P幀和B幀 159
6.3.2 視頻碼流的分層結構 160
6.3.3 MPEG-1/MPEG-2視頻編解碼原理 163
6.3.4 MPEG-2的功能擴展 164
6.4 MPEG-4視頻編碼標準 166
6.4.1 概述 166
6.4.2 MPEG-4視頻編碼功能與特點 167
6.4.3 MPEG-4基於內容的視頻編碼 168
6.5 H.263視頻編碼標準 169
6.5.1 視頻信源圖像格式 169
6.5.2 H.263視頻編解碼原理 170
6.5.3 H.263可選模式 171
6.5.4 H.263+的可選模式 173
6.5.5 H.263++的可選模式 173
6.6 H.264/AVC視頻編碼標準 173
6.6.1 H.264/AVC編碼器的分層結構 174
6.6.2 H.264/AVC中的預測編碼 175
6.6.3 整數變換與量化 176
6.6.4 基於上下文的自適應熵編碼 179
6.7 AVS視頻編碼標準 180
6.7.1 AVS-P2 180
6.7.2 AVS-P2與H.264的比較 184
6.8 小結 185
習題 186
第7章 數字音頻編碼技術及標準 187
7.1 數字音頻壓縮編碼概述 187
7.1.1 數字音頻壓縮編碼的機理 187
7.1.2 音頻編/解碼器的性能指標 188
7.1.3 數字音頻編碼技術的分類 191
7.1.4 數字音頻編碼標準概述 193
7.2 常用數字音頻編碼技術 197
7.2.1 線性預測編碼 197
7.2.2 矢量量化 199
7.2.3 CELP編碼 200
7.2.4 子帶編碼 202
7.3 MPEG-1音頻編碼標準 203
7.3.1 MPEG-1音頻編碼算法的特點 203
7.3.2 MPEG-1音頻編碼的基本原理 205
7.4 MPEG-2 AAC音頻編碼標準 210
7.4.1 概述 210
7.4.2 MPEG-2 AAC編碼算法和特點 210
7.4.3 MPEG-2 AAC的檔次 213
7.5 中國制定的音頻編碼標準 214
7.5.1 AVS音頻立體聲編碼標準 214
7.5.2 DRA多聲道數字音頻編解碼標準 216
7.6 小結 219
習題 219
第8章 數字媒體檔案格式 220
8.1 資源交換檔案格式(RIFF) 220
8.2 數字圖像檔案格式 222
8.2.1 點陣圖和調色板的概念 222
8.2.2 圖像檔案的一般結構 224
8.2.3 BMP檔案格式 224
8.2.4 GIF檔案格式 228
8.2.5 JPEG檔案交換格式 232
8.2.6 其他圖像檔案格式 235
8.3 常見的動畫檔案格式 238
8.3.1 FLI/FLC檔案格式 238
8.3.2 SWF檔案格式 239
8.4 數字視頻檔案格式 241
8.4.1 AVI檔案格式 241
8.4.2 MPEG/MPG/DAT/DivX/XviD 245
8.5 數字音頻檔案格式 247
8.5.1 WAV檔案格式 247
8.5.2 MPEG音頻(MP1/MP2/MP3/AAC)檔案格式 249
8.5.3 其他音頻檔案格式 250
8.6 流媒體檔案格式 253
8.6.1 Real Media檔案格式 253
8.6.2 ASF檔案格式 255
8.6.3 QuickTime檔案格式 258
8.6.4 FLV檔案格式 259
8.6.5 其他流媒體檔案格式 261
8.7 小結 261
習題 263
第9章 數字水印技術 264
9.1 數字水印概述 264
9.1.1 數字水印技術的產生背景和套用 264
9.1.2 數字水印的基本特徵 265
9.1.3 數字水印系統的組成 267
9.1.4 數字水印的分類 269
9.2 數字圖像水印算法 270
9.2.1 最低有效位方法 270
9.2.2 基於DCT域的方法 272
9.3 數字視頻水印的嵌入和提取方案 273
9.3.1 基於未壓縮的原始視頻的水印方案 273
9.3.2 基於視頻編碼的水印方案 274
9.3.3 基於壓縮視頻碼流的水印方案 274
9.4 數字音頻水印算法 275
9.4.1 最低有效位方法 276
9.4.2 回聲隱藏方法 277
9.4.3 相位編碼方法 278
9.4.4 變換域方法 278
9.4.5 基於壓縮音頻方法 279
9.5 MATLAB編程實例 279
9.6 小結 285
習題 285
第10章 基於內容的多媒體信息檢索 286
10.1 基於內容檢索技術概述 286
10.1.1 多媒體信息的內容 286
10.1.2 內容處理技術 287
10.1.3 基於內容檢索的查詢方式 288
10.1.4 基於內容檢索系統的一般結構 288
10.1.5 基於內容的檢索過程 290
10.1.6 基於內容檢索的特點 290
10.2 基於內容的圖像檢索 291
10.2.1 基於內容的圖像檢索概述 291
10.2.2 圖像顏色特徵的提取與表示 294
10.2.3 圖像紋理特徵的提取與表示 296
10.2.4 圖像形狀特徵的提取與表示 297
10.2.5 圖像空間關係特徵的提取與表示 298
10.2.6 圖像的相似性度量 299
10.2.7 圖像檢索中的相關反饋機制 300
10.3 基於內容的視頻檢索 301
10.3.1 基於內容的視頻檢索概述 301
10.3.2 視頻內容的結構化 302
10.3.3 基於內容的視頻檢索工作流程 303
10.3.4 基於內容的視頻檢索系統結構 304
10.3.5 鏡頭切換的基本概念 305
10.3.6 鏡頭邊界檢測 307
10.3.7 關鍵幀的提取 308
10.3.8 鏡頭聚類(場景檢測) 310
10.4 基於內容的音頻檢索 311
10.4.1 音頻內容的特徵表示 311
10.4.2 基於內容的音頻檢索概述 311
10.4.3 基於內容的語音檢索 312
10.4.4 基於內容的音樂檢索 313
10.5 小結 315
習題 315
參考文獻 316