人工語音頻寬擴展新方法研究

人工語音頻寬擴展新方法研究

《人工語音頻寬擴展新方法研究》是依託大連理工大學,由陳喆擔任項目負責人的面上項目。

基本介紹

  • 中文名:人工語音頻寬擴展新方法研究
  • 依託單位:大連理工大學
  • 項目類別:面上項目
  • 項目負責人:陳喆
項目摘要,結題摘要,

項目摘要

針對從某個頻段信號估計其它頻段信息這個典型問題,本項目以語音信號為研究對象,採用壓縮感知、盲信號處理及信號重建等理論,研究語音信號頻寬擴展新方法。主要包括:研究變換域內的人工語音頻寬擴展(BWE)新方法;在較好地估計和恢復某些特定頻帶獨有參數的基礎上,研究基於碼流的廣義語音頻寬擴展方法;在有效進行頭相關傳遞函式與單聲道頻寬擴展方法融合的基礎上,研究雙聲道語音頻寬擴展新方法;研究300Hz以下頻帶頻寬擴展新方法。在分析、明確噪聲對語音頻寬擴展算法主要參數作用機理的基礎上,進行參數選擇最佳化和參數韌性估計的研究。以性能優良的新方法為基礎,建立一個語音頻寬擴展實時處理系統,並進行語音頻寬擴展性能測試。項目研究成果將揭示壓縮感知等共性理論在語音頻寬擴展中的套用規律,完善語音信號處理理論。此外,研究成果在語音及音頻編碼、語音識別、語音消噪、3D音頻、虛擬超重低音和無線廣播等領域也具有顯著的套用價值。

結題摘要

本項目對人工語音頻寬擴展新方法研究進行了深入研究,主要成果有:(1)提出了非參數模型的語音頻寬擴展新技術路線;基於該路線,提出了基於稀疏表示與K-SVD的人工語音頻寬擴展新方法,提出了基於經驗模式分解(EMD)的人工語音頻寬擴展新方法。(2)提出了廣義語音頻寬擴展的概念,即在語音編碼器的碼流域直接進行擴展頻寬,進而提出廣義語音頻寬擴展新策略;針對兩種典型語音編碼器(G.729和AMR),提出了相應的廣義語音頻寬擴展新方法。(3)結合語音分層編碼技術和信息隱藏技術,提出了盲語音頻寬擴展新方法。(4)研究了基於G-P外推算法的語音頻寬擴展方法和低頻語音頻寬擴展方法。(5)為增強語音頻寬擴展方法的魯棒性,克服房間混響和噪聲的不利影響,研究了房間混響與瞬態噪聲的抑制問題,包括:提出了基於改進的最小控制遞歸平均和最優修正對數譜幅度估計的瞬態噪聲抑制方法,提出了基於語音信號重建的瞬態噪聲抑制方法,提出了譜減法和復倒譜域濾波的混響抑制方法,提出了譜減法和基於譜線增強的混響抑制方法。(6)研究了頭相關傳遞函式(HRTF)的高效壓縮和個性化方法。(7)建立了人工語音頻寬擴展實時處理及演示系統。

相關詞條

熱門詞條

聯絡我們