基於感知信息的語音增強及客觀質量評估

基於感知信息的語音增強及客觀質量評估

《基於感知信息的語音增強及客觀質量評估》是依託深圳大學,由丁惠君擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於感知信息的語音增強及客觀質量評估
  • 項目類別:青年科學基金項目
  • 項目負責人:丁惠君
  • 依託單位:深圳大學
項目摘要,結題摘要,

項目摘要

語言是人類最自然的交流方式,具有不可替代的地位。由於在獲取、傳輸、存儲當中存在的不完善性,語音信號存在嚴重的失真。而語音增強算法,就是用來去除背景噪聲,改善語音質量的。我們在過去的研究工作中,已經提出了幾種變換域中的語音增強算法包括維納濾波等,很好地實現了上述目標。但是,增強後的語音是否很符合人類聽覺認知和需求,仍然未知。因此,基於新型感知信息的語音增強算法將被進一步研究,並加強清音與濁音以降低去噪過程中造成的語音干擾,最終實現更符合人耳聽覺感知的新型算法。另外,在語音質量評估方面,客觀質量評估方法因其便捷性和高效性而被廣泛採用。然而,現有的絕大多數客觀質量評估方法,只能給受測試的增強後的語音打一個分數,以判斷優劣。但這個判斷相當模糊,功能性不明。本項目因此提出了基於感知信息的客觀質量評估方法,以提供多角度的更多更明確的判斷,使之更可靠、更貼近人類主觀判斷。

結題摘要

語言是人類最自然的交流方式,具有不可替代的地位。由於在獲取、傳輸、存儲當中存在的不完善性,語音信號存在嚴重的失真。而語音增強算法,就是用來去除背景噪聲,改善語音質量的。現有的大部分語音增強算法致力於增加信噪比,但是增強後的語音是否符合人類聽覺認知和需求,仍然未知。因此,本項目致力於研究基於感知信息的語音增強及客觀質量評估方法。在過去三年的研究實踐中,我們完成了基於感知信息的語音增強和客觀質量評估方法的研發。在現有的語音增強算法當中,主要是選取了人耳掩蔽效應這一感知信息,該模型在不同變換域之間的轉換和連線,是能否融合這一聽覺感知信息的科學問題核心。我們將一種二維的心理聲學模型引入到本項目的研究中,將人耳掩蔽效應很好的融合於梅爾譜係數中,實現了為自動語音識別系統服務的語音增強,並取得較高的語音識別率,成功地實現了基於感知信息語音增強的研發目的。另一方面,一種新穎的在時域和頻域均可實施的三維語音質量客觀評估方法被提出,它除了包含現有的總體主觀印象這一維度信息之外,還拓展出了基於背景噪聲和語音干擾兩個維度的信息。通過分析純淨語音與去噪語音之間的差值,即殘留信號,探索它與純淨語音之間的相關性得到對語音干擾的判斷,同時通過計算純淨語音與殘留噪聲的信噪比得到對背景噪聲的判斷,最後通過對兩者的線性擬合得到對總體質量的判斷。取得的客觀質量評估結果具有更可靠、更貼近主觀聽力測試結果的特性,解決了現有客觀質量方法評估結果單一、指示不明的問題,實現了基於感知信息開發客觀質量評估方法的目的,該方法還在粵語及國語材料上進行了測試。綜上可知,在為期三年的研究中,通過解決關鍵的科學問題基本實現了全部預期研究成果,從心理聲學模型及人類聽覺感知等角度指導語音增強算法和客觀質量評估方法的開發,建立基於背景噪聲和語音干擾的主觀印象的新型感知信息機制,豐富聽覺感知信息體系,促進其與工程套用,特別是與語音處理技術的有機結合,為其進一步的發展提供新穎的見解和可靠的理論依據。已在國內外權威雜誌和一流學術會議上發表9篇高水平學術論文,其中7篇為期刊論文,2篇為國際會議論文。在技術開發及人才培養方面也取得良好的結果。今後將會繼續開展本項目的研究工作,不斷推進其同相關領域產業的有機結合,由於本項目是以人為本的基礎研究項目,因此同多媒體通訊、醫療康復等領域有較好的套用前景,值得不斷的投入和推動。

相關詞條

熱門詞條

聯絡我們