基於壓縮感知的語音信號建模與編碼技術研究

中文摘要

隨著編碼速率的降低，傳統的語音編碼模型和方法難以實現高質量語音編碼。壓縮感知（Compressed Sensing,CS）理論與奈奎斯特採樣定理不同，具有直接信息採樣特徵，是對傳統信號採樣方法的一次新的革命，基於CS的語音信號描述和處理框架為語音編碼技術研究提供了全新的思路和方法。本項目將CS理論和傳統的語音編碼技術相結合，研究語音信號的CS性能、基於CS的語音信號建模方法和編碼技術，解決語音信號及其編碼參數的稀疏變換、CS觀測矩陣的構造與實現、超低速率條件下語音編碼參數的高效量化、CS框架下語音信號的高質量L1最佳化重構等問題。在此基礎上，建立一套新的語音編碼方案，實現高質量中速率、低速率和超低速率語音編碼，支持的編碼速率從32kbps到300bps。本項目是對逼近語音編碼速率極限研究的有意義探索，研究成果可用於軍用短波、超短波、衛星通信等領域，具有重要的理論研究意義、軍事意義和實用價值。

結題摘要

壓縮感知具有高效的信息處理能力，藉助其實現語音壓縮編碼就成為了一種新方法的探索。為使壓縮感知與語音信號更好地結合發揮其在壓縮編碼上的優勢，項目主要從三個大的方面展開研究工作：1、語音稀疏表示方法研究。主要研究了稀疏性度量指標、語音稀疏化途徑及相應的幾種稀疏表示手段。研究發現語音信號可以進行稀疏表示，具備利用壓縮感知進行處理的條件，同時，受稀疏表示手段等諸多因素的影響，實際效果不盡相同，目前的語音稀疏化水平還有待進一步提升。2、壓縮感知處理語音的模型研究。主要圍繞對語音信號的觀測和重構問題結合非均勻採樣理論提出了一種非均勻觀測方法，並有針對性地給出了一種重構流程。在此基礎上，還論證了非均勻採樣與壓縮感知之間的異同，通過實驗數據分析認為非均勻採樣與壓縮感知在語音信號信息獲取能力上效果相當，而且非均勻採樣在實用性方面更具有優勢。此外，還針對語音傳輸和存儲兩種套用背景分別提出了語音壓縮感知框架。3、壓縮感知在語音編碼中的套用研究。圍繞如何降低編碼速率的問題，從語音觀測數據的高效量化編碼出發，分別利用標量量化和分裂矢量量化方法進行編碼，結果表明矢量量化方法要明顯優於標量量化方法，在16kbps的中速率語音編碼上基本可用，但語音質量並不是很好。為進一步降低編碼速率，構建了語音編碼參數的壓縮感知方法，結合相關參數編碼技術在低速率和極低速率語音編碼上進行了仿真實驗，結果表明低編碼速率下語音質量較差，僅可作為語音編碼的一種方法，而不足以取代現有編碼技術。在以上研究工作的基礎上，最後總結了研究中的一些經驗，並指出了存在的問題，在此基礎上，指出了還有待更深入進行研究的幾個問題及對應思路。

基於壓縮感知的語音信號建模與編碼技術研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條