基於聽覺與認知的複雜音頻質量客觀評價方法研究

《基於聽覺與認知的複雜音頻質量客觀評價方法研究》是依託上海大學,由朱夢堯擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於聽覺與認知的複雜音頻質量客觀評價方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:朱夢堯
  • 依託單位:上海大學
中文摘要,結題摘要,

中文摘要

數字音頻製作、傳輸、處理、播放等設備的廣泛使用,推動了數字音頻套用的快速普及。然而,複雜的音頻技術和落後的音頻質量評價方法之間的矛盾日益突出。音頻質量的評價研究成為制約音頻技術和設備進一步發展的瓶頸。本項目研究基於聽覺與認知的複雜音頻質量客觀評價方法,旨在通過研究人對音頻質量評價的聽覺機理和認知過程,建立統一的複雜音頻質量評價模型。課題的創新性研究包括:(1)基於時頻混合變換的聽覺感知模型,提高客觀評價的聽覺一致性;(2)音色和空間質量的特徵參數提取和選擇方法,提高客觀評價的認知完備性;(3)基於Bootstrap重採樣的時延神經網路認知模型,提高客觀評價的認知魯棒性;最終形成與人類主觀感受相一致的複雜音頻質量客觀評價系統。

結題摘要

本研究針對複雜音頻質量的客觀評價開展。研究方案緊密圍繞人耳聽覺感知模型和深度認知學習方法,取得了如下創新成果:(1)根據功率譜估計PSE理論,提出了循環分幀處理方法,完善了聽覺模型的預處理機制;(2)對包含外中內耳的計算聽覺感知CASP模型進行改進,提出了帶有頻域擴散和掩蔽效應的改進CASP聽覺感知模型,改善了音頻客觀質量評價的性能;(3)提出了基於改進CASP的雙耳聽覺感知模型,用於空間聲的聲源位置評價;(4)基於結構相似度理論,提出了聽覺模型調製域結構相似度特徵提取方法;(5)針對空間聲評價問題,提出了雙耳聽覺模型的雙耳差異特徵提取方法;(6)基於深度學習,提出了無監督的音頻質量評價的特徵提取方法。(7)基於線性認知和非線性認知的機器學習理論,提出了基於深層認知學習的客觀質量分數回歸方法。這些結果論證了我們提出的通過人耳聽覺模型和大腦認知機理客觀評價複雜音頻的質量,為新一代通信、娛樂、影視等領域的聽感客觀評價提供了理論支撐。

相關詞條

熱門詞條

聯絡我們