基於空間相關性的3D音頻聚類分組壓縮技術研究

基於空間相關性的3D音頻聚類分組壓縮技術研究

《基於空間相關性的3D音頻聚類分組壓縮技術研究》是依託武漢大學,由高戈擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於空間相關性的3D音頻聚類分組壓縮技術研究
  • 項目類別:面上項目
  • 項目負責人:高戈
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

隨著MPEG啟動3D音頻壓縮標準化進程,面向直播的3D音頻壓縮技術已成為3D音頻領域的研究熱點。與傳統音頻技術不同,三維音頻系統採用大量揚聲器重建三維聲像,導致3D音頻數據隨聲道數線性增長,迫切需要提高3D音頻信號的壓縮效率。針對傳統3D音頻編碼技術難以有效地將相關性強的聲道信號進行分組編碼的問題,提出基於空間聚類特性的3D音頻信號動態分組方法,解決傳統欠分組和過分組引起的效率下降和音質損失問題;針對傳統矩陣編碼技術用於3D音頻編碼時無法有效去除冗餘的問題,提出面向動態分組的矩陣編碼,實現3D音頻聲道信號間冗餘的高效去除;提出面向動態分組和矩陣編碼的感知閾值模型。與現有3D音頻壓縮技術相比,在運算複雜度相當的情況下,3D音頻信號的壓縮效率至少提高10%。本項目從編碼器架構、聲道間信號壓縮和聲道內信號壓縮三方面提高了3D音頻壓縮效率,預期可以推動3D音頻標準制定和產業快速發展。

結題摘要

隨著MPEG啟動3D音頻壓縮標準化進程,面向直播的3D音頻壓縮技術已成為3D音頻領域的研究熱點。與傳統音頻技術不同,三維音頻系統採用大量揚聲器重建三維聲像,導致3D音頻數據隨聲道數線性增長,迫切需要提高3D音頻信號的壓縮效率。針對傳統3D音頻編碼難以有效地將相關性強的聲道信號進行分組編碼的問題,提出基於空間相關性的信號動態分組方法,引入了3D音頻信號的時空域相關分析,聚類強相關信號並進行分組,提高分組後冗餘去除算法的效果。針對傳統矩陣編碼用於3D音頻編碼時無法有效去除冗餘的問題,提出面向動態分組的矩陣編碼方法,保證冗餘去除的高效性,並使信號間不產生混疊現象,提高編碼的主客觀音質;提出面向矩陣變換的感知閾值模型,對核心編碼器的感知閾值模型進行修正,保證變換後信號感知編碼最最佳化,提高3D音頻編碼的主觀音質。主觀音質相當時,與基於和差的3D音頻編碼相比,壓縮效率提高14.35%。為了更有效地對指向性很強的主聲源分量和具有很寬聲場的環境聲分量進行編碼,提出基於最小二乘的主聲源-環境聲提取方法,將主聲源-環境聲提取問題轉換為加權矩陣估計問題,通過最小二乘法提取主聲源分量和環境聲分量。在提取誤差和環境聲分量的空間參數方面,明顯優於傳統的PCA方法。針對音源對象間空間參數壓縮率不高的問題,提出三維空間參數動態量化編碼方法,用人耳對音源的三維空間方位感知特性,生成三維空間位置矢量量化碼本;利用對象所圍成的空間區域範圍作為約束條件,動態選擇空間參數局部矢量量化碼本,降低空間參數編碼碼率。主觀音質相當時,與MPEG SAOC的對象間空間參數編碼方法相比,平均碼率可降低29.46%。項目實施過程中,在本領域相關會議和期刊上發表論文16篇,其中ICME、PCM等音頻編碼和聲學研究領域的國際會議發表論文13篇,SCI檢索的國際期刊上發表論文3篇。申請國家發明專利8項,其中授權4項,受理4項。提交3D音頻編解碼標準提案3項。

相關詞條

熱門詞條

聯絡我們