《MPEG-4/H.264視頻編解碼工程實踐》是2011年出版的圖書,作者是路錦正。
MPEG-4/H.264視頻編解碼工程實踐,內容簡介,前 言,目 錄,
MPEG-4/H.264視頻編解碼工程實踐
MPEG-4/H.264視頻編解碼工程實踐
路錦正 編著
ISBN 978-7-121-14787-6
2011年11月出版
定價:59元
16開
384頁
內容簡介
數字視頻編解碼已經形成了一個巨大的產業,視頻編解碼算法是其技術核心。本書介紹了基於Visual C++2005及TI DSP平台進行視頻算法最佳化的實現過程和技術難點,並提供了書中所有原始碼。主要內容包括:視頻編解碼原理及視頻圖像的捕獲與顯示、基於Visual C++2005分析MPEG-4/H.264編解碼原理、基於TI DSP設計和最佳化開源工程(Xvid/x264/ffmpeg)、視頻算法的標準接口xDAIS開發和視頻監控中心軟體設計等。
本書中的案例均來源於筆者開發中的工程實踐,具有很強的實用價值。讀者既可以基於案例進行特定的開發,也可以直接套用。
附書光碟包含書中所有案例的源檔案。
本書內容充實,工程實用性強。面向高年級本科生、工程/專業/學術碩士、算法工程師等致力於視頻編解碼算法開發的人員,為其課程設計、畢業設計和項目研發等提供實戰指南和案例參考。
前 言
視頻的編解碼是數字視頻開發套用中的最主要方面,海量的視頻數據為便於存儲和傳輸、節約資源,必須進行一定程度的編碼壓縮。視頻編解碼在數字多媒體套用中占有極為重要的比重,已經形成了一個巨大的產業。從VCD、DVD到現在的MP4、IPTV、硬碟錄像機、可視電話、高畫質電視等;從早期的閉路電視監控CCTV(Closed Circuit Television)到現在的數字視頻錄像DVR(Digital Video Recorder)等。編解碼算法是上述系統中的核心技術,因此掌握自主產權的視頻算法就極其重要。
由於視頻編解碼原理較複雜,涉及了許多數學知識——從數據的DCT/DWT變換,到基於圖像塊的運動估計和運動補償,均勻量化和非均勻量化技術,還有可變長度熵編碼如Huffman編碼和算術編碼等。視頻編解碼協定複雜,系統代碼量大,功能模組多。幸運的是,大量開源視頻算法為我們學習和實踐視頻算法提供了實用的算法工程。主流視頻編解碼算法中當數MPEG-4/H.264算法標準,但其協定標準僅規定了碼流語義,並沒有明確如何進行工程實現。Xvid是公認優秀的MPEG-4開源視頻編、解碼算法工程,X264是公認優秀的H.264開源視頻編碼算法工程。這些開源算法一方面主要採用跨平台的C語言編程,另一方面做核心模組面向常用CPU(Intel/AMD)的多媒體彙編指令做了系列最佳化。
基於可程式晶片(如DSP/FPGA)實時實現視頻編解碼算法是一件非常具有挑戰性的工作,一方面需要對複雜算法本身深入理解;另一方面需要對研發平台的數據處理特點及彙編指令等有相當經驗的把握。但對於一般的高年級本科生甚至研究生來說,同時熟練掌握算法和實現平台可能就不是一件容易的事情了。筆者以自己多年從事音視頻編解碼算法開發的切身體會出發,總結開發技術要點、凝練開發技巧、分享實戰項目經驗,為致力於視頻編解碼算法最佳化的研究開發人員提供指南和參考。
從目前市面上有關視頻編解碼的書籍來看,原理介紹性的多,工程實用性的少;技術規格翻譯的多,項目實戰經驗共享的少。筆者幾年前就想編寫一本視頻編解碼實用性強的著作。正是基於上述各種因素的分析,終於催生了本書。筆者期待讀者快速步入視頻編解碼開發的技術殿堂。
同時,筆者也真誠期望本書能夠拋磚引玉,與相關技術人員共同探討和學習,信息分享、共同進步。
讀者對象高年級本科生在畢業設計階段,其工程能力弱,時間短任務重,迫切需要該類指南;我國碩士研究生,特別是工程碩士,實際在校時間短,理論基礎相對薄弱而工程能力較強,迫切需要項目實踐經驗參考;專業/學術碩士的課題一方面有視頻編解碼的直接套用,另一方面又有基於視頻編解碼的其他套用,如目標識別或跟蹤,實用工程案例可提供支持;公司企業的算法最佳化工程師、新員工,短期內掌握並提高質量完成視頻算法最佳化技術難度較大,而視頻算法是系統核心技術,為提升員工自身價值需掌握核心算法最佳化技術。本書約定
本書所使用的軟體有:Windows XP(SP3)、Visual C++ 2005簡體中文專業版、CCS 3.3。
致謝說明
本書由路錦正編著,同時參加編寫的還有李偉、張強林、吳艷、萬雷、王呼佳、趙騰倫、王斌、魏雪輝、趙會春、王曉、余松、夏慧軍、陳軍等老師。本書吸收了由筆者主編的《Visual C++音頻/視頻處理技術及工程實踐》一書中的部分章節,並對多數章節做了修改、補充,同時吸收了前書的讀者反饋意見,使本書更貼近實用。本書是筆者在假期完成的,故犧牲了陪家人的時間,因此,特別感謝妻子郭晶女士的無私奉獻和默默支持,感謝女兒帶給我的無窮快樂和對工作的無窮動力。感謝成都道然科技有限責任公司以及徐津平老師對著書工作的大力支持。另外,本書參考了網路上的部分公開資源,在此對其所有者一併表示感謝。
由於時間倉促,加之水平有限,書中不足之處在所難免,懇請讀者批評指正。最後還需要感謝電子工業出版社辛苦工作的老師們,他們為本書的順利出版付出了很多辛勤勞動。
路錦正
2011年8月
目 錄
第1章 視頻編解碼基礎
1.1 視頻編碼的必要性和可行性
1.2 視頻編碼壓縮原理及主流算法
1.3 視頻解碼原理及主流解碼器
1.4 ASIC與可程式晶片
1.5 開源的視頻CODEC
1.6 本章小結
第2章 建立和生成編解碼視頻序列
2.1 視頻數據來源
2.2 DirectShow實現視頻採集
2.3 VFW技術實現視頻採集
2.4 YUV序列圖像顯示
2.5 本章小結
第3章 Xvid實現MPEG-4視頻編解碼
3.1 概述
3.2 Xvid視頻編碼分析
3.3 Xvid視頻解碼分析
3.4 Xvid的MMX/SSE技術最佳化
3.5 運行Xvid系統
3.6 Xvid編解碼實驗
3.7 本章小結
第4章 數字媒體處理器TI DM64x開發平台
4.1 概述
4.2 適於數字媒體處理的DSP
4.3 DSP開發環境CCS
4.4 視頻算法DM64x平台最佳化
4.5 數字媒體處理器TI DM642DSP
4.6 本章小結
第5章 DM642平台最佳化設計Xvid視頻編解碼
5.1 最佳化準備
5.2 DM642視頻算法最佳化策略
5.3 DM642平台下最佳化Xvid視頻編碼
5.4 DM642平台下最佳化Xvid視頻解碼
5.5 平台最佳化實驗及分析
5.6 本章小結
第6章 x264實現H.264視頻編碼
6.1 H.264概述
6.2 H.264視頻算法原理
6.3 x264視頻編碼分析
6.4 編譯運行x264
6.5 系統效果展示
6.6 本章小結
第7章 ffmpeg實現H.264視頻解碼
7.1 ffmpeg套用基礎
7.2 ffmpeg工作流程分析
7.3 H.264解碼過程剖析
7.4 H.264視頻解碼實驗
7.5 本章小結 278
第8章 媒體處理器DM642最佳化H.264視頻編碼
8.1 概述
8.2 創建H.264視頻編碼器
8.3 使用H.264視頻編碼器
8.4 銷毀H.264視頻編碼器
8.5 實驗H.264視頻編碼器
8.6 本章小結
第9章 eXpressDSP算法接口標準開發
9.1 xDAIS開發基礎
9.2 H.264編碼算法的xDAIS封裝
9.3 使用xDAIS封裝的H.264編碼庫
9.4 本章小結
第10章 視頻監控中心軟體設計
10.1 概述
10.2 點陣圖界面設計
10.3 多路圖像的高效顯示
10.4 使用視頻監控中心軟體
10.5 本章小結
參考文獻