基本介紹
- 書名:新一代高效視頻編碼技術
- 作者:卓力 張菁
- 出版日期:2013年11月1日
- 語種:簡體中文
- ISBN:9787115325396, 7115325391
- 外文名:High Efficiency Video Coding Techiques for Next Generation
- 出版社:人民郵電出版社
- 頁數:242頁
- 開本:16
- 品牌:人民郵電出版社
基本介紹,內容簡介,作者簡介,圖書目錄,
基本介紹
內容簡介
有關新一代高效視頻編碼的學術專著;
反映相關領域的最新研究進展;
科研工作的理想參考書;
注重理論基礎知識和最新研究成果之間的平衡;
先進性和實用性的完美統一;
語言流暢,圖文並茂,可讀性好。
反映相關領域的最新研究進展;
科研工作的理想參考書;
注重理論基礎知識和最新研究成果之間的平衡;
先進性和實用性的完美統一;
語言流暢,圖文並茂,可讀性好。
作者簡介
卓力 博士,北京工業大學教授、博士生導師1992年畢業於電子科技大學無線電技術系,1998年和2004年分別獲得東南大學信號與信息處理專業碩士學位和北京工業大學模式識別與智慧型系統專業博士學位。2006年一2007年在悉尼大學從事博士後研究工作。作為項目負責人主持了國家自然科學基金、“863”計畫等20多個項目的研究工作。發表學術論文180餘篇,出版3部專著,譯著5部。先後入選“教育部新世紀優秀人才支持計畫”、“人力資源與社會保障部留學歸國人員科技活動優秀類資助計畫”、“北京市科技新星計畫”、“北京市優秀人才培養計畫”、“北京市中青年骨幹教師培養計畫”和“北京工業大學京華計畫”等。主要研究方向為圖像,視頻編碼與傳輸、多媒體信息安全和多媒體內容分析等。張菁 博士,北京工業大學副教授、碩士生導師2008年獲北京工業大學電路與系統專業博士學位。作為項目負責人主持國家自然科學基金2項,作為主要研究人員先後參加了國家自然科學基金、北京市自然科學基金等項目的研究工作。入選“北京市屬高校青年拔尖人才培養計畫”和“北京市優秀人才培養計畫”。發表學術論文50餘篇。出版專著1部,譯著2部。主要研究方向為圖像,視頻信號與信息處理、圖像檢索等。李曉光 博士,北京工業大學副教授、碩士生導師2003年獲得北京工業大學工學學士學位,推免研究生;2005年提前攻博,2008年獲得北京工業大學工學博士學位。曾多次赴香港理工大學從事合作研究,2012年在悉尼大學做訪問學者。
作為項目負責人主持了國家自然科學基金青年基金、北京市自然科學基金以及企事業單位委託項目,作為主要研究人員參加了“863”計畫、國家自然科學基金等項目的研究工作。發表學術論文40餘篇,2008年獲得ICNNSP08最佳論文獎。出版專著2部,譯著2部。主要研究方向為超解析度復原、圖像/視頻信號與信息處理等。
作為項目負責人主持了國家自然科學基金青年基金、北京市自然科學基金以及企事業單位委託項目,作為主要研究人員參加了“863”計畫、國家自然科學基金等項目的研究工作。發表學術論文40餘篇,2008年獲得ICNNSP08最佳論文獎。出版專著2部,譯著2部。主要研究方向為超解析度復原、圖像/視頻信號與信息處理等。
圖書目錄
第1章 視頻格式和質量評價
1.1 圖像與視頻
1.2 彩色空間
1.2.1 RGB彩色空間
1.2.2 YCbCr彩色空間
1.2.3 HSV彩色空間
1.3 抽樣格式
1.4 視頻格式
參考文獻
第2章 視頻質量評價
2.1 引言
2.2 視頻失真
2.2.1 塊效應
2.2.2 模糊效應
2.2.3 振鈴效應
2.2.4 噪聲
2.3 主觀質量評價
2.3.1 測試條件
2.3.2 測試方法
2.3.3 評分類型
2.3.4 主觀質量評價方法
2.4 客觀質量評價
2.4.1 FR評價標準
2.4.2 NR評價方法
參考文獻
第3章 視頻編碼技術基礎
3.1 預測編碼
3.2 變換編碼
3.2.1 正交變換
3.2.2 K—L變換
3.2.3 離散餘弦變換
3.2.4 小波變換
3.3 熵編碼
3.4 矢量量化
3.5 混合編碼
參考文獻
第4章 人眼視覺系統特性
4.1 視覺信息處理的基本機理
4.1.1 視覺感官
4.1.2 視覺通路
4.1.3 視覺中樞
4.1.4 視覺感知
4.2 感興趣區的人眼視覺系統特性
4.2.1 視覺感興趣區
4.2.2 視覺掩蓋效應
4.3 人眼的視覺注意特性
4.3.1 視覺注意機制
4.3.2 視覺注意模型
4.4 基於視覺注意模型的壓縮域感興趣區檢測方法
4.4.1 壓縮域視覺顯著圖提取
4.4.2 視覺注意焦點的選擇與轉移
4.4.3 壓縮域感興趣區域檢測
4.4.4 實驗結果及分析
4.5 本章小結
參考文獻
第5章 碼率控制
5.1 碼率控制基本原理
5.2 碼率控制模式
5.2.1 恆定碼率模式
5.2.2 可變碼率模式
5.3 碼率控制理論
5.3.1 率失真函式
5.3.2 幾種經典的率失真模型
5.4 視頻標準中的碼率控制算法
5.4.1 VM5碼率控制算法
5.4.2 RM8碼率控制算法
5.4.3 TMN8碼率控制算法
5.4.4 TM5碼率控制算法
5.4.5 H.264碼率控制算法
5.5 基於H.264的幀層碼率控制算法
5.5.1 H.264率失真曲線
5.5.2 H.264率失真模型
5.5.3 基於率失真模型的碼率控制
5.5.4 實驗結果及分析
參考文獻
第6章 H.264/AVC視頻編碼新技術
6.1 H.264/AVC視頻編碼基本框架
6.2 基於行的H.264/AVC幀內預測編碼
6.2.1 隱式的基於行的幀內預測
6.2.2 實驗結果
6.3 H.264/AVC中可變位深的8×8整型變換和量化編碼
6.3.1 H.264/AVC中的8×8整型變換
6.3.2 H.264/AVC的量化和縮放
6.4 基於無損視頻信號統計特性的H.264/AVC自適應熵編碼器設計
6.4.1 無損編碼中殘差數據的統計特性
6.4.2 改進的CAVLC方法
6.4.3 改進的CABAC方法
6.4.4 實驗結果及分析
6.5 H.264視頻編碼的並行可擴展性
6.5.1 H.264中的並行計算
6.5.2 GOP級並行計算
6.5.3 幀級並行計算
6.5.4 片級並行計算
6.5.5 宏塊級並行計算
6.5.6 空間域宏塊級並行計算
6.5.7 時間域宏塊級並行計算
參考文獻
第7章 H.264/SVC可擴展視頻編碼
7.1 引言
7.2 H.264/SVC編碼框架
7.2.1 時間可擴展性
7.2.2 空間可擴展性
7.2.3 SNR可擴展性
7.3 H.264 SVC編碼性能評估
7.3.1 時間可擴展性
7.3.2 空間可擴展性
7.3.3 SNR可擴展性
7.3.4 其他特點
7.3.5 預處理濾波
參考文獻
第8章 HEVC視頻編碼標準
8.1 HEVC標準的結構
8.1.1 檔次、級別和層
8.1.2 視頻格式
8.1.3 條帶和分片
8.2 HEVC的基本編碼框架
8.2.1 HEVC基本編碼框架
8.2.2 HEVC的編碼單元和編碼結構
8.3 HEVC關鍵技術
8.3.1 幀內預測
8.3.2 幀間預測
8.3.3 變換、縮放和量化
8.3.4 熵編碼
8.3.5 環內濾波器
8.3.6 特殊編碼模式
8.4 HEVC編碼器控制
8.5 HEVC的語法結構
8.5.1 並行解碼語法和改進的條帶結構
8.5.2 HEVC高級語法
8.6 HEVC編碼工具配置
參考文獻
第9章 小波視頻編碼新技術
9.1 引言
9.2 傳統離散小波變換的缺點
9.3 雙樹小波變換
9.3.1 DTDWT
9.3.2 DTDWT濾波器組
9.3.3 三維DTDWT
9.4 粒子集群最佳化和多目標PSO
9.4.1 粒子集群最佳化
9.4.2 多目標PSO
9.5 基於多目標PSO的視頻編碼
9.5.1 編碼器模組的修改
9.5.2 實驗結果與分析
參考文獻
第10章 基於壓縮感知的視頻編碼技術
10.1 引言
10.2 壓縮感知理論
10.2.1 稀疏性
10.2.2 不相干性
10.2.3 測量矩陣
10.2.4 CS重建
10.2.5 壓縮感知特性
10.3 壓縮視頻感知
10.4 分散式壓縮視頻感知
10.5 基於字典的壓縮視頻感知
10.6 本章小結
參考文獻
第11章 基於人眼視覺系統特性的視頻編碼
11.1 基於視覺敏感度的低比特圖像壓縮
11.1.1 人眼的視覺敏感度特徵
11.1.2 基於視覺敏感度的低比特率圖像壓縮算法
11.2 基於視覺注意的視頻編碼方法
11.2.1 所提方法框圖
11.2.2 目標檢測算法
11.2.3 背景和目標區域的JPEG—2000編碼
11.2.4 視頻解碼重建
11.2.5 實驗結果與分析
11.3 基於人眼感興趣區的視頻編碼
11.3.1 感興趣區檢測和跟蹤
11.3.2 H.264/SVC標準的感興趣區編碼
11.3.3 感興趣區編碼的碼率控制
11.4 本章小結
參考文獻
第12章 視頻編碼技術的最新研究進展
12.1 基於語義的視頻編碼
12.1.1 語義視頻編碼
12.1.2 用戶感知的語義視頻編碼
12.2 基於超解析度復原的視頻編碼
12.2.1 超解析度復原技術概述
12.2.2 基於超解析度復原的視頻編碼技術
12.3 基於HEVC的立體視頻編碼技術
12.3.1 立體視頻編碼標準
12.3.2 幾種立體視頻編碼方案
12.3.3 基於HEVC的立體視頻編碼方案
參考文獻
1.1 圖像與視頻
1.2 彩色空間
1.2.1 RGB彩色空間
1.2.2 YCbCr彩色空間
1.2.3 HSV彩色空間
1.3 抽樣格式
1.4 視頻格式
參考文獻
第2章 視頻質量評價
2.1 引言
2.2 視頻失真
2.2.1 塊效應
2.2.2 模糊效應
2.2.3 振鈴效應
2.2.4 噪聲
2.3 主觀質量評價
2.3.1 測試條件
2.3.2 測試方法
2.3.3 評分類型
2.3.4 主觀質量評價方法
2.4 客觀質量評價
2.4.1 FR評價標準
2.4.2 NR評價方法
參考文獻
第3章 視頻編碼技術基礎
3.1 預測編碼
3.2 變換編碼
3.2.1 正交變換
3.2.2 K—L變換
3.2.3 離散餘弦變換
3.2.4 小波變換
3.3 熵編碼
3.4 矢量量化
3.5 混合編碼
參考文獻
第4章 人眼視覺系統特性
4.1 視覺信息處理的基本機理
4.1.1 視覺感官
4.1.2 視覺通路
4.1.3 視覺中樞
4.1.4 視覺感知
4.2 感興趣區的人眼視覺系統特性
4.2.1 視覺感興趣區
4.2.2 視覺掩蓋效應
4.3 人眼的視覺注意特性
4.3.1 視覺注意機制
4.3.2 視覺注意模型
4.4 基於視覺注意模型的壓縮域感興趣區檢測方法
4.4.1 壓縮域視覺顯著圖提取
4.4.2 視覺注意焦點的選擇與轉移
4.4.3 壓縮域感興趣區域檢測
4.4.4 實驗結果及分析
4.5 本章小結
參考文獻
第5章 碼率控制
5.1 碼率控制基本原理
5.2 碼率控制模式
5.2.1 恆定碼率模式
5.2.2 可變碼率模式
5.3 碼率控制理論
5.3.1 率失真函式
5.3.2 幾種經典的率失真模型
5.4 視頻標準中的碼率控制算法
5.4.1 VM5碼率控制算法
5.4.2 RM8碼率控制算法
5.4.3 TMN8碼率控制算法
5.4.4 TM5碼率控制算法
5.4.5 H.264碼率控制算法
5.5 基於H.264的幀層碼率控制算法
5.5.1 H.264率失真曲線
5.5.2 H.264率失真模型
5.5.3 基於率失真模型的碼率控制
5.5.4 實驗結果及分析
參考文獻
第6章 H.264/AVC視頻編碼新技術
6.1 H.264/AVC視頻編碼基本框架
6.2 基於行的H.264/AVC幀內預測編碼
6.2.1 隱式的基於行的幀內預測
6.2.2 實驗結果
6.3 H.264/AVC中可變位深的8×8整型變換和量化編碼
6.3.1 H.264/AVC中的8×8整型變換
6.3.2 H.264/AVC的量化和縮放
6.4 基於無損視頻信號統計特性的H.264/AVC自適應熵編碼器設計
6.4.1 無損編碼中殘差數據的統計特性
6.4.2 改進的CAVLC方法
6.4.3 改進的CABAC方法
6.4.4 實驗結果及分析
6.5 H.264視頻編碼的並行可擴展性
6.5.1 H.264中的並行計算
6.5.2 GOP級並行計算
6.5.3 幀級並行計算
6.5.4 片級並行計算
6.5.5 宏塊級並行計算
6.5.6 空間域宏塊級並行計算
6.5.7 時間域宏塊級並行計算
參考文獻
第7章 H.264/SVC可擴展視頻編碼
7.1 引言
7.2 H.264/SVC編碼框架
7.2.1 時間可擴展性
7.2.2 空間可擴展性
7.2.3 SNR可擴展性
7.3 H.264 SVC編碼性能評估
7.3.1 時間可擴展性
7.3.2 空間可擴展性
7.3.3 SNR可擴展性
7.3.4 其他特點
7.3.5 預處理濾波
參考文獻
第8章 HEVC視頻編碼標準
8.1 HEVC標準的結構
8.1.1 檔次、級別和層
8.1.2 視頻格式
8.1.3 條帶和分片
8.2 HEVC的基本編碼框架
8.2.1 HEVC基本編碼框架
8.2.2 HEVC的編碼單元和編碼結構
8.3 HEVC關鍵技術
8.3.1 幀內預測
8.3.2 幀間預測
8.3.3 變換、縮放和量化
8.3.4 熵編碼
8.3.5 環內濾波器
8.3.6 特殊編碼模式
8.4 HEVC編碼器控制
8.5 HEVC的語法結構
8.5.1 並行解碼語法和改進的條帶結構
8.5.2 HEVC高級語法
8.6 HEVC編碼工具配置
參考文獻
第9章 小波視頻編碼新技術
9.1 引言
9.2 傳統離散小波變換的缺點
9.3 雙樹小波變換
9.3.1 DTDWT
9.3.2 DTDWT濾波器組
9.3.3 三維DTDWT
9.4 粒子集群最佳化和多目標PSO
9.4.1 粒子集群最佳化
9.4.2 多目標PSO
9.5 基於多目標PSO的視頻編碼
9.5.1 編碼器模組的修改
9.5.2 實驗結果與分析
參考文獻
第10章 基於壓縮感知的視頻編碼技術
10.1 引言
10.2 壓縮感知理論
10.2.1 稀疏性
10.2.2 不相干性
10.2.3 測量矩陣
10.2.4 CS重建
10.2.5 壓縮感知特性
10.3 壓縮視頻感知
10.4 分散式壓縮視頻感知
10.5 基於字典的壓縮視頻感知
10.6 本章小結
參考文獻
第11章 基於人眼視覺系統特性的視頻編碼
11.1 基於視覺敏感度的低比特圖像壓縮
11.1.1 人眼的視覺敏感度特徵
11.1.2 基於視覺敏感度的低比特率圖像壓縮算法
11.2 基於視覺注意的視頻編碼方法
11.2.1 所提方法框圖
11.2.2 目標檢測算法
11.2.3 背景和目標區域的JPEG—2000編碼
11.2.4 視頻解碼重建
11.2.5 實驗結果與分析
11.3 基於人眼感興趣區的視頻編碼
11.3.1 感興趣區檢測和跟蹤
11.3.2 H.264/SVC標準的感興趣區編碼
11.3.3 感興趣區編碼的碼率控制
11.4 本章小結
參考文獻
第12章 視頻編碼技術的最新研究進展
12.1 基於語義的視頻編碼
12.1.1 語義視頻編碼
12.1.2 用戶感知的語義視頻編碼
12.2 基於超解析度復原的視頻編碼
12.2.1 超解析度復原技術概述
12.2.2 基於超解析度復原的視頻編碼技術
12.3 基於HEVC的立體視頻編碼技術
12.3.1 立體視頻編碼標準
12.3.2 幾種立體視頻編碼方案
12.3.3 基於HEVC的立體視頻編碼方案
參考文獻