多媒體技術教程(原書第2版)

多媒體技術教程(原書第2版)

《多媒體技術教程(原書第2版)》是2019年機械工業出版社出版的圖書。本書從多媒體數據表現、多媒體數據壓縮、多媒體通信和聯網、多媒體信息分享和檢索四個層面對多媒體涉及的基本概念、基本原理和基本技術進行了詳細介紹。

基本介紹

  • 中文名:多媒體技術教程(原書第2版)
  • 作者:勵澤年(Ze-Nian Li)、馬克·S.德魯(Mark S. Drew)
  • 出版社:機械工業出版社
  • ISBN:9787111626008
內容簡介,圖書目錄,作者簡介,

內容簡介

本書由多媒體領域三位學者聯袂編寫,內容取自課堂上講述的實際素材,適合作為計算機科學和工程專業學生的教材。本書從多媒體數據表現、多媒體數據壓縮、多媒體通信和聯網、多媒體信息分享和檢索四個層面對多媒體涉及的基本概念、基本原理和基本技術進行了詳細介紹。作者用一種實用的方式來講述基本概念,使學生能夠運用享有的技術來解決現實多媒體世界中的問題。

圖書目錄

出版者的話
譯者序
前言
第一部分 多媒體概述和數據表現
第1章 多媒體導論2
 1.1 什麼是多媒體2
  1.1.1 多媒體的組成部分2
 1.2 多媒體:歷史和現狀3
  1.2.1 多媒體的早期歷史3
  1.2.2 超媒體、全球資訊網和Internet6
  1.2.3 新世紀的多媒體8
 1.3 多媒體軟體工具概述10
  1.3.1 編曲和譜曲10
  1.3.2 數字音頻11
  1.3.3 圖形和圖像編輯11
  1.3.4 視頻編輯11
  1.3.5 動畫12
  1.3.6 多媒體編著12
 1.4 未來的多媒體13
 1.5 練習14
 參考文獻15
第2章 走進多媒體16
 2.1 多媒體任務和關注點16
 2.2 多媒體展示16
 2.3 數據壓縮20
 2.4 多媒體製作22
 2.5 多媒體共享和分發23
 2.6 多媒體編輯和編著工具25
  2.6.1 Adobe Premiere25
  2.6.2 Adobe Director28
  2.6.3 Adobe Flash31
 2.7 練習34
 參考文獻36
第3章 圖形和圖像的數據表現37
 3.1 圖形/圖像的數據類型37
  3.1.1 1點陣圖像37
  3.1.2 8位灰度圖像38
  3.1.3 圖像數據類型40
  3.1.4 24位彩色圖像40
  3.1.5 高位深度圖像40
  3.1.6 8位彩色圖像41
  3.1.7 顏色查找表42
 3.2 常見的檔案格式45
  3.2.1 GIF45
  3.2.2 JPEG47
  3.2.3 PNG48
  3.2.4 TIFF48
  3.2.5 Windows BMP49
  3.2.6 Windows WMF49
  3.2.7 Netpbm Format49
  3.2.8 EXIF49
  3.2.9 PS和PDF49
  3.2.10 PTM50
 3.3 練習51
 參考文獻52
第4章 圖像和視頻中的顏色53
 4.1 顏色科學53
  4.1.1 光和光譜53
  4.1.2 人的視覺54
  4.1.3 眼睛的光譜靈敏度54
  4.1.4 圖像的形成55
  4.1.5 相機系統55
  4.1.6 伽馬校正55
  4.1.7 顏色匹配函式57
  4.1.8 CIE色度圖58
  4.1.9 彩色顯示器規格60
  4.1.10 超色域的顏色61
  4.1.11 白點校正61
  4.1.12 XYZ到RGB的轉換62
  4.1.13 帶伽馬校正的轉換62
  4.1.14 L*a*b*(CIELAB)顏色模型63
  4.1.15 其他顏色坐標系統64
  4.1.16 蒙賽爾顏色命名系統64
 4.2 圖像中的顏色模型64
  4.2.1 顯示器的顏色模型64
  4.2.2 多感測器相機65
  4.2.3 相機相關的顏色65
  4.2.4 減色法:CMY顏色模型66
  4.2.5 從RGB到CMY的轉換67
  4.2.6 消除不足顏色:CMYK系統67
  4.2.7 印表機色域67
  4.2.8 多墨水印表機68
 4.3 視頻中的顏色模型68
  4.3.1 視頻顏色轉換68
  4.3.2 YUV顏色模型69
  4.3.3 YIQ顏色模型70
  4.3.4 YCbCr顏色模型71
 4.4 練習72
 參考文獻74
第5章 視頻中的基本概念75
 5.1 模擬視頻75
  5.1.1 NTSC視頻77
  5.1.2 PAL視頻79
  5.1.3 SECAM視頻79
 5.2 數字視頻79
  5.2.1 色度的二次採樣80
  5.2.2 數字視頻的CCIR和ITU-R標準80
  5.2.3 高畫質電視81
  5.2.4 超高畫質電視82
 5.3 視頻顯示接口82
  5.3.1 模擬顯示接口82
  5.3.2 數字顯示接口84
 5.4 3D視頻和電視85
  5.4.1 3D感知線索85
  5.4.2 3D相機模型86
  5.4.3 基於立體視覺的3D電影和電視87
  5.4.4 視覺輻輳調節衝突87
  5.4.5 自由立體(無眼鏡)顯示設備88
  5.4.6 3D內容創建過程中的視差處理89
 5.5 練習90
 參考文獻90
第6章 數字音頻基礎92
 6.1 聲音數位化92
  6.1.1 什麼是聲音92
  6.1.2 數位化93
  6.1.3 奈奎斯特理論94
  6.1.4 信噪比95
  6.1.5 信號量化噪聲比96
  6.1.6 線性量化和非線性量化97
  6.1.7 音頻濾波100
  6.1.8 音頻質量與數據率100
  6.1.9 合成的聲音101
 6.2 樂器數字接口102
  6.2.1 MIDI概述103
  6.2.2 MIDI硬體105
  6.2.3 MIDI訊息的結構106
  6.2.4 通用MIDI109
  6.2.5 MIDI到WAV的轉換109
 6.3 音頻的量化和傳輸109
  6.3.1 音頻的編碼109
  6.3.2 脈衝編碼調製110
  6.3.3 音頻的差分編碼111
  6.3.4 無損預測編碼112
  6.3.5 DPCM114
  6.3.6 DM116
  6.3.7 ADPCM117
 6.4 練習118
 參考文獻120
第二部分 多媒體數據壓縮
第7章 無損壓縮算法122
 7.1 簡介122
 7.2 資訊理論基礎123
 7.3 遊程編碼125
 7.4 變長編碼125
  7.4.1 香農凡諾算法125
  7.4.2 赫夫曼編碼127
  7.4.3 自適應赫夫曼編碼130
 7.5 基於字典的編碼133
 7.6 算術編碼137
  7.6.1 基本的算術編碼算法137
  7.6.2 縮放和增量編碼140
  7.6.3 算術編碼的整數實現143
  7.6.4 二進制算術編碼143
  7.6.5 自適應算術編碼144
 7.7 無損圖像壓縮146
  7.7.1 圖像的差分編碼146
  7.7.2 無損JPEG147
 7.8 練習148
 參考文獻150
第8章 有損壓縮算法151
 8.1 簡介151
 8.2 失真度量151
 8.3 比率失真理論152
 8.4 量化152
  8.4.1 均勻標量量化152
  8.4.2 非均勻標量量化154
  8.4.3 向量量化155
 8.5 變換編碼156
  8.5.1 離散餘弦變換157
  *8.5.2 Karhunen-Loève變換167
 8.6 小波編碼169
  8.6.1 簡介169
  *8.6.2 連續小波變換172
  *8.6.3 離散小波變換173
 8.7 小波包181
 8.8 小波係數的嵌入式零樹181
  8.8.1 零樹數據結構182
  8.8.2 逐次逼近量化183
  8.8.3 EZW示例183
 8.9 層次樹的集合劃分185
 8.10 練習186
 參考文獻188
第9章 圖像壓縮標準189
 9.1 JPEG標準189
  9.1.1 JPEG圖像壓縮的主要步驟189
  9.1.2 JPEG模式195
  9.1.3 JPEG位流概述197
 9.2 JPEG2000標準198
  *9.2.1 JPEG2000圖像壓縮的主要步驟199
  9.2.2 使EBCOT適合JPEG2000204
  9.2.3 感興趣區域編碼205
  9.2.4 JPEG和JPEG2000的性能比較205
 9.3 JPEG-LS標準207
  9.3.1 預測208
  9.3.2 確定上下文208
  9.3.3 殘差編碼208
  9.3.4 近似無損模式208
 9.4 二值圖像壓縮標準209
  9.4.1 JBIG標準209
  9.4.2 JBIG2標準209
 9.5 練習211
 參考文獻213
第10章 視頻壓縮技術基礎214
 10.1 視頻壓縮簡介214
 10.2 基於運動補償的視頻壓縮214
 10.3 搜尋運動向量215
  10.3.1 順序搜尋216
  10.3.2 2D對數搜尋217
  10.3.3 分層搜尋218
 10.4 H.261220
  10.4.1 I幀編碼220
  10.4.2 P幀編碼221
  10.4.3 H.261中的量化221
  10.4.4 H.261的編碼器和解碼器222
  10.4.5 H.261視頻位流語法概述223
 10.5 H.263225
  10.5.1 H.263的運動補償226
  10.5.2 H.263可選的編碼模式226
  10.5.3 H.263 和H.263 228
 10.6 練習228
 參考文獻230
第11章 MPEG視頻編碼:MPEG-1、MPEG-2、MPEG-4和MPEG-7231
 11.1 概述231
 11.2 MPEG-1231
  11.2.1 MPEG-1的運動補償231
  11.2.2 與H.261的其他主要區別233
  11.2.3 MPEG-1視頻位流235
 11.3 MPEG-2236
  11.3.1 支持隔行掃描視頻237
  11.3.2 MPEG-2的可伸縮性239
  11.3.3 與MPEG-1的其他主要區別243
 11.4 MPEG-4243
  11.4.1 MPEG-4概述243
  11.4.2 MPEG-4的基於對象的視覺編碼245
  11.4.3 MPEG-4的合成對象編碼254
  11.4.4 MPEG-4部分、規範和層次260
 11.5 MPEG-7260
  11.5.1 描述子261
  11.5.2 描述方案263
  11.5.3 描述定義語言265
 11.6 練習265
 參考文獻266
第12章 新視頻編碼標準:H.264和H.265269
 12.1 H.264269
  12.1.1 運動補償270
  12.1.2 整數變換272
  12.1.3 量化和縮放274
  12.1.4 H.264整數變換和量化示例275
  12.1.5 幀內編碼277
  12.1.6 環路去塊濾波278
  12.1.7 熵編碼279
  12.1.8 上下文自適應可變長度編碼280
  12.1.9 上下文自適應二進制算術編碼282
  12.1.10 H.264配置檔案283
  12.1.11 H.264可伸縮視頻編碼285
  12.1.12 H.264多視點視頻編碼285
 12.2 H.265286
  12.2.1 運動補償286
  12.2.2 整數變換290
  12.2.3 量化和縮放290
  12.2.4 幀內編碼291
  12.2.5 離散正弦變換291
  12.2.6 環路濾波292
  12.2.7 熵編碼293
  12.2.8 特殊編碼模式293
  12.2.9 H.265配置檔案294
 12.3 視頻編碼效率的比較294
  12.3.1 客觀評估294
  12.3.2 主觀評估295
 12.4 練習295
 參考文獻296
第13章 音頻壓縮技術基礎298
 13.1 語音編碼中的ADPCM298
  13.1.1 ADPCM298
 13.2 G.726 ADPCM,G727-9299
 13.3 聲音合成器300
  13.3.1 相位不敏感性300
  13.3.2 通道聲音合成器301
  13.3.3 共振峰聲音合成器302
  13.3.4 線性預測編碼302
  13.3.5 碼激勵線性預測304
  *13.3.6 混合激勵聲音合成器309
 13.4 練習311
 參考文獻312
第14章 MPEG音頻壓縮313
 14.1 心理聲學簡介313
  14.1.1 等響度關係313
  14.1.2 頻率掩蔽314
  14.1.3 時間掩蔽318
 14.2 MPEG音頻319
  14.2.1 MPEG的層319
  14.2.2 MPEG音頻策略319
  14.2.3 MPEG音頻壓縮算法320
  14.2.4 MPEG-2高級音頻編碼325
  14.2.5 MPEG-4音頻326
 14.3 其他音頻編解碼器326
  14.3.1 Ogg Vorbis326
 14.4 MPEG-7音頻及其他328
 14.5 進一步探索328
 14.6 練習328
 參考文獻329
第三部分 多媒體通信和網路
第15章 多媒體通信的網路服務及協定332
 15.1 計算機通信網路的協定層332
 15.2 區域網路和接入網333
  15.2.1 區域網路標準333
  15.2.2 乙太網技術334
  15.2.3 接入網技術335
 15.3 網際網路技術和協定338
  15.3.1 網路層:IP338
  15.3.2 傳輸層:傳輸控制協定和用戶數據報協定340
  15.3.3 網路地址轉換和防火牆343
 15.4 組播延伸344
  15.4.1 基於路由

作者簡介

勵澤年(Ze-Nian Li)現為加拿大西蒙弗雷澤大學計算機科學學院教授。研究方向為:計算機視覺、多媒體和人工智慧。長期講授多媒體系統、計算機視覺和機器視覺課程;負責設定本科生和研究生在視覺和多媒體方向的教學課程;開發了與浙江大學合作的雙學位課程。李澤年教授本科畢業於中國科學技術大學電子工程專業,隨後分別於1981年和1986年獲得美國威斯康星大學麥迪遜分校計算機科學碩士和博士學位。
馬克·S• 德魯(Mark S. Drew)現為加拿大西蒙弗雷澤大學計算機科學學院教授。研究方向為:圖像處理、計算機視覺、計算機圖形學、多媒體和可視化。講授課程包括:多媒體系統、圖像和視頻中的光照。
劉江川(Jiangchuan LIU ) 現為加拿大西蒙弗雷澤大學計算機科學學院教授,江行智慧型CEO&董事長。他是IEEE Fellow,並於2015年獲得加拿大國家自然科學與工程研究理事會(NSERC)授予傑出青年教授的*高獎項E.W.R. Steacie紀念獎。他還是清華大學EMC講席教授,清華大學深圳研究生院兼職教授、博導,微軟學者,香港科技大學博士,清華大學計算機系學士。研究方向為:網路和多媒體;尤其是多媒體內容處理和通信、無線行動網路、RFID、雲和大數據計算、線上遊戲和社交網路以及點對點網路。

相關詞條

熱門詞條

聯絡我們