三維音頻基礎理論與關鍵技術研究

三維音頻基礎理論與關鍵技術研究

《三維音頻基礎理論與關鍵技術研究》是依託武漢大學,由胡瑞敏擔任項目負責人的重點項目。

基本介紹

  • 中文名:三維音頻基礎理論與關鍵技術研究
  • 項目類別:重點項目
  • 項目負責人:胡瑞敏
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

MPEG啟動3D音頻標準化進程吸引了3D音頻技術領域研究者的廣泛關注,基於感知的3D音頻處理技術已成為實現3D音頻信息高效表達與重建的關鍵技術和重要研究方向。基於2D技術發展起來的傳統3D音頻系統採集與回放系統結構異常複雜,海量數據存儲與傳輸資源需求倍增,3D評測技術亟待改進。針對上述問題,本課題擬研究3D空間音頻感知機理,提出空間感知失真模型並探索空間採樣最佳化方法;研究3D空間可感知信息量度量方法,建立3D音頻方位可感知信息計算模型,給出3D音頻參數化高效表達方法;研究揚聲器和聽音區域的約束機理,建立3D聲場一致性分布模型以擴大重建聲場的最佳聽音區域;研究3D音頻中高度信息表達能力,分析雙工耳廓譜效應,進一步完善3D音頻客觀評價技術。通過上述工作初步建立基於感知的3D音頻空間採集、高效參數編碼、聲場重建與評價的理論技術體系,提高信號壓縮效率和重建質量,推動3D音頻標準制定和產業快速發展。

結題摘要

傳統3D音頻系統能給聽音者帶來3D聲場效果,但是揚聲器數量太多,限制了其套用範圍,系統精簡導致空間參數的損失;3D音頻系統重建中揚聲器位置擺放主要依賴經驗,並未開展揚聲器位置最佳化方法的理論研究也未分析重建聲場質量下降的內在機理;在碼率受到實時轉播頻寬和存儲媒介容量限制的情況下,傳統參數編碼會導致三維音頻的空間方位感失真,空間聲效質量會顯著下降。3D空間音源距離信息恢復、揚聲器組精簡與最佳化和3D音頻信號高效壓縮技術,能夠提高3D音頻信號壓縮效率和重建質量,推動3D音頻標準制定和產業快速發展。在3D空間音源距離信息恢複方面:建立重建前後聲源距離線索與方向線索一致的距離恢復模型,提升了距離感的恢復精度;提出基於球諧展開的Ambisonics音頻距離重現方法。在揚聲器精簡與最佳化方面:構建基於聲壓和粒子速度的多聲道系統全局最最佳化精簡模型;提出保證雙耳聽音區域失真最小的3D多聲道音頻系統揚聲器組精簡算法。相關成果發表在國際權威會議(ICASSP,ICME);在3D音頻信號高效壓縮方面:基於感知靈敏度數據建立三維空間方位感知模型;提出全方位空間參數非均勻感知編碼方法;構建符合人耳全方位感知特性的量化編碼框架,空間參數量化比特數平均可降低40%以上。相關成果獲湖北省科技進步一等獎。上述研究方向在該領域專利持有數均全國第一。其他方面:提出三維空間諧波係數轉換方法,實現了三維空間上的多區域聲場重放和多聲源聲場重建;搭建了國內首個3D音頻實驗室;致力於國際、國家及行業標準的制訂,1項技術提案被AVS音頻組採納,參與制定的IEEE國際標準P1857.5正式發布。在本項目的實施過程中,在本領域期刊(IEEE Trans,JASA等)和國際會議(ICASSP、ICME等)上發表論文91篇,其中SCI論文13篇,EI論文84篇;申請發明專利37項,其中授權23項;培養博士研究生10名,碩士研究生46名,在讀博士研究生6名,碩士研究生12名;參加本領域主流國際會議ICASSP、ICME等20餘次,邀請德國弗里德里希-亞歷山大教授、美國俄亥俄州立大學汪德亮教授等多名IEEE Fellow在內的國內外專家訪問交流。

相關詞條

熱門詞條

聯絡我們