基於雙耳線索的移動音頻編碼研究

基於雙耳線索的移動音頻編碼研究

《基於雙耳線索的移動音頻編碼研究》是2014年武漢大學出版社出版的圖書,作者是陳水仙。

基本介紹

  • 中文名:基於雙耳線索的移動音頻編碼研究
  • 作者:陳水仙
  • 出版時間:2014年1月
  • 出版社:武漢大學出版社
  • ISBN:9787307123182
內容簡介,圖書目錄,

內容簡介

飛速發展的移動市場對高品質音頻業務的需求日 益迫切,移動 環境下音頻頻寬不足,終端資源有限,傳統音頻理論 和技術面臨新 的挑戰。近年來,MPEG、ITU和AVS等國內外標準化組 織積極推 動移動音頻理論和技術研究。基於雙耳線索的音頻編 碼因其在低碼 率下的音質優勢而備受關注,然而,為適應移動環境 苛刻的套用需 求,仍需克服空間參數模型的理論缺陷,突破實變換 域雙耳線索表 示的技術瓶頸,解決空間參數碼率難以下降、系統復 雜度偏高等問 題。陳水仙編著的這本《基於雙耳線索的移動音頻編 碼研究》開展基於雙耳線索的移動音頻編碼研究,在 雙耳線索感知 機理分析、空間感知信息度量、MDCT域雙耳線索表示 和空間音頻 編碼系統結構設計這四個方向上取得了創新性成果。
在雙耳線索感知機理分析方向,《基於雙耳線索 的移動音頻編碼研究》針對現有系統只能去除聲 道間數據客觀冗餘的不足,以巴克頻帶為感知分析單 元,開展了對 雙耳線索臨界感知JND的分析研究,提出基於感知的 雙耳線索參 數表示模型,有效去除了聲道問數據的主觀冗餘信息 ,下降 4.28%~11.78%的空間參數碼率,主觀測試MUSHRA 得分平均提 高2.6分,客觀測試ODG得分平均提高1.1分。
在空間感知信息度量方向,本書針對建立在單耳 聽音模型上的 感知熵理論無法度量雙耳空間感知信息量的問題,結 合雙耳線索的 感知機理,建立了基於雙耳線索生理感知的BCPPM模 型來模擬雙 耳對空間信息的感知過程,提出基於模型的空間感知 熵SPE的計 算方法,解決了雙耳空間感知信息量的度量問題,豐 富和發展了空 間音頻編碼技術的理論和實踐。
在MDCT域雙耳線索表示方向,本書針對MDCT實變 換的相 位信息缺失及能量抖動造成雙耳線索表示不準確的問 題,採用基函 數“和分離”技術,提出了基於共軛窗函式的MDCT頻 譜複數化擴 展方法,並針對新方法引入MDST帶來複雜度增加的問 題,提出了 基於轉換矩陣稀疏性的MDCT-MDST快速轉換算法,同 時利用轉換 矩陣的正交性和循環性,將複雜度從O(N*2)下降到O (N),主觀測 試MUSHRA得分平均提高2.07分,客觀ODG得分平均提 高 0.4281分。
在空間音頻編碼系統結構設計方向,本書針對空 間信息和下混 信息分離處理模式導致的系統複雜度高和延時長的問 題,採用濾波 復用和並行處理的技術,提出並行濾波共享的分析綜 合ABS編碼 結構,去除了空間參數編碼與下混聲道編碼中的冗餘 操作,縮短了 5%的系統延時,減少了38%~86%的運算複雜度。
本書在基礎理論和關鍵技術方面的研究成果可望 成為國內移動音頻標準的支撐技術,增強我國在高速 成長的全球移動音頻產業中 的核心競爭力,為全面參與移動音頻編解碼領域的國 際競爭和標準 化工作奠定堅實的研究基礎。

圖書目錄

第1章 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 冗餘信息去除技術
1.2.2 感知信息度量方法
1.3 面臨的關鍵問題
1.3.1 空間參數主觀冗餘難以去除
1.3.2 MDCT域空間參數分析困難
1.4 主要工作和全文組織結構
1.4.1 主要工作
1.4.2 全文組織結構
第2章 雙耳線索的特徵分析與表示
2.1 引言
2.2 雙耳線索的特徵分析實驗系統
2.2.1 特徵分析實驗系統設計
2.2.2 雙耳線索臨界感知的頻率依賴性
2.2.3 雙耳線索的統計分布特性
2.3 編碼系統中的雙耳線索編碼實現
2.3.1 基於頻率感知的參數集選取
2.3.2 基於頻率感知的參數量化和熵編碼
2.4 實驗與性能分析
2.4.1 參數碼率分析與比較
2.4.2 主觀性能分析與比較
2.4.3 客觀性能分析與比較
2.5 本章小結
第3章 雙耳線索感知信息的度量
3.1 引言
3.2 基於雙耳聽音的生理感知模型構建
3.2.1 空間信息的物理層表示
3.2.2 空間信息的生理感知
3.2.3 雙耳線索生理感知模型BCPPM
3.3 基於BCPPM模型的空間感知熵計算
3.3.1 空間感知熵的定義
3.3.2 臨界頻帶濾波單元
3.3.3 雙耳線索計算單元
3.3.4 有效感知量計算單元
3.4 實驗與性能分析
3.4.1 立體聲序列的信息量估算方法對比
3.4.2 不同序列SPE數值的差異分析
3.4.3 同一序列SPE隨時間的變化分析
3.5 本章小結
第4章 MDCT域雙耳線索的分析與合成
4.1 引言
4.2 基於共軛窗函式的MDcT複數化擴展
4.2.1 雙耳線索的形成機理
4.2.2 MDCT頻譜對雙耳線索的影響:
4.2.3 基於共軛窗函式的MDCT複數化擴展
4.2.4 實驗與性能分析
4.3 基於C2S轉換的雙耳線索分析
4.3.1 MDCT-MDST快速轉換
4.3.2 C2S轉換矩陣的稀疏化近似
4.3.3 CMCLT域的雙耳線索表示
4.4 實驗與性能分析
4.4.1 主觀性能分析與比較
4.4.2 客觀性能分析與比較
4.5 本章小結
第5章 基於合成分析的空間音頻編碼結構
5.1 引言
5.2 空間音頻編碼系統的基礎操作模組
5.2.1 聲源分離模組
5.2.2 下混/上混模組
5.2.3 空間參數分析模組
5.2.4 系統結構的優缺點
5.3 並行濾波共享的ABS編碼結構
5.3.1 頻帶劃分對空間信息分析的影響
5.3.2 ABS編碼結構設計
5.3.3 並行結構下的濾波共享
5.4 實驗與性能分析
5.4.1 系統延時分析
5.4.2 計算複雜度分析
5.4.3 系統性能分析
5.5 本章小結
第6章 總結與展望
6.1 研究工作總結
6.2 研究展望
參考文獻
致謝
附錄

相關詞條

熱門詞條

聯絡我們