(甚)低速率語音編碼關鍵問題研究

(甚)低速率語音編碼關鍵問題研究

《(甚)低速率語音編碼關鍵問題研究》是依託同濟大學,由趙曉群擔任項目負責人的面上項目。

基本介紹

  • 中文名:(甚)低速率語音編碼關鍵問題研究
  • 項目類別:面上項目
  • 項目負責人:趙曉群
  • 依託單位:同濟大學
中文摘要,結題摘要,

中文摘要

本項目針對頻帶資源有限的水聲通信,研究(甚)低速率水聲語音編碼中的關鍵問題,主要包括:(1)聲道參數:利用自適應幀內、幀間聯合預測編碼的方法降低聲道參數的編碼比特,或將節省下來的比特數用於提升編碼器的魯棒性,使其能抵抗水聲信道的強幹擾環境;(2)聲門激勵:利用線性預測分析方法和希爾伯特-黃等非線性信號分析方法對不同幀模式下的聲門激勵信號進行分析和重構,儘可能地逼近語音短時平穩模型的理想情況,提高編碼器的合成語音自然度。本項目所設計的實驗將在我們已經構建的淺海水聲信道綜合實驗軟體平台的基礎上開展研究,並最終通過FPGA硬體平台對算法進行實現和驗證。通過對上述問題的研究,預期可以提升(甚)低速率語音編碼方案的魯棒性和合成語音的自然度,促進其在水聲通信中的套用。另外,依託本項目進一步加強國際合作與交流,同時為我國在語音編碼及水聲通信領域的人才培養做出貢獻。

結題摘要

本項目對(甚)低速率語音編碼算法中的諸多關鍵技術進行分析和研究,設計並實現適用於水聲信道的編碼算法。本項目涉及聲道參數、聲門激勵、基音估計、清濁音判決、編碼算法設計及在ARM上的移植最佳化等關鍵技術,主要研究成果包括: (1)聲道參數:通過對聲道編碼參數分析和統計,發現可利用線譜頻率(LSF)參數具有較強的幀內幀間相關性,且相鄰幀間LSF參數的相關性呈線性趨勢這一特性,設計偏最小二乘算法及其簡化模型來對超幀中的LSF參數進行預測,並在此基礎上提出一些高效實用的LSF參數碼書訓練算法,有效地降低聲道參數量化比特。(2)聲門激勵:利用線性預測分析方法和希爾伯特-黃等非線性信號分析方法對清濁音幀模式下的聲門激勵信號進行了分析,將經驗模態分解算法引入到語音清濁音幀激勵信號的構造中;提出了一種基於語音截止頻率的語音編碼激勵模型。 水聲環境下準確的基音估計和清濁音判決是構造理想聲門激勵的基礎,因此,提出了一種基於幅度壓縮基音估計濾波的清濁音分類及基音估計方法;給出了一種無訓練過程的自適應抗噪的清/濁/靜音判決方法;分析了基於譜減算法和小波變換算法的語音增強技術在實際背景噪聲環境下的性能,及其在水聲信道低速率編解碼技術中的工程適用性等。 根據水聲語音編碼的特點,設計了2.4 ,1.84(2種),1.2,1.12,0.88,0.8共7種(甚)低速率語音編碼方案,編碼後的語音清晰,具有較好的自然度和可懂度。開發了基於ARM的軟硬體平台,並將7種編碼算法在該平台上進行了實現和最佳化,經測試表明,所設計編碼算法能滿足水聲通信實際需求。

相關詞條

熱門詞條

聯絡我們