《面向語音識別的抗噪支持向量機最佳化算法》是依託太原理工大學,由張雪英擔任項目負責人的面上項目。
基本介紹
- 中文名:面向語音識別的抗噪支持向量機最佳化算法
- 項目類別:面上項目
- 項目負責人:張雪英
- 依託單位:太原理工大學
項目摘要,結題摘要,
項目摘要
目前多數語音識別系統只適合於識別乾淨的語音,當存在背景噪聲或訓練和測試環境不同時,識別系統會出現性能急劇下降的現象,因此,抗噪語音識別系統的研究就具有重要意義。申請者前期研究工作表明,在非特定人、小辭彙量、不同信噪比環境下,使用SVM進行語音識別比使用HMM、ANN具有更好的識別率和抗噪性。在此基礎上,本項目通過進一步研究,提出適合語音識別套用的核函式以及混沌自適應非線性微分慣性權重微粒群最佳化核參數的方法;從理論上深入分析SVM具有的魯棒性以及各種SVM的算法特性,提出適合噪音環境下語音識別的SVM新算法;使用改進MFCC特徵和改進ZCPA前端特徵,對上述工作建立的最佳化SVM語音識別模型進行對比實驗,給出特徵提取和識別部分的最佳組合,完成信噪比降低至10dB、5dB及0dB的實驗及把識別辭彙量逐步擴大到500詞以及連線數字語音的識別實驗;最終建立面向語音識別的抗噪SVM模型。
結題摘要
目前多數語音識別系統只適合於識別“乾淨”的語音,當存在背景噪聲或訓練和測試環境不同時,識別系統會出現性能急劇下降的現象,因此,抗噪語音識別系統的研究就具有重要意義。申請者前期研究工作表明,在非特定人、小辭彙量、不同信噪比環境下,使用SVM進行語音識別比使用HMM、ANN具有更好的識別率和抗噪性。在此基礎上,本項目按照課題計畫進行,研究了較大辭彙量、低信噪比情況下建立SVM語音識別模型以改善識別系統性能的相關問題。主要從語音資料庫、語音特徵提取、預選取、多類分類方法、核函式、參數最佳化及支持向量機訓練這幾個相互關聯的方面開展了研究,所做主要工作包括: ①研究了若干支持向量機的預選取、多類分類方法。其中預選取方法比未預選取減少了平均46.13個百分點的時間,糾錯輸出編碼比其他多類分類方法的識別率平均高4個百分點,是最好的支持向量機多類分類方法。重點研究了支持向量機核函式的選擇、構造,研究了超核函式、小波核函式、切比雪夫核函式、ORF核函式等內容,這些核函式在不同的語音實驗中均有成效。實驗表明,在TIDigits語音庫上,ORF核函式比RBF核函式識別率高9.4個百分點。針對核函式的參數尋優,研究了小生境並行人工魚群算法、人工蜂群等算法,實驗表明,小生境並行人工魚群算法比未尋優前識別率提高了2.8個百分點。 ②為改善語音識別系統的抗噪性,從理論上深入分析了支持向量機具有的魯棒性以及各種支持向量機的算法特性,提出了模糊Bv-SVM算法,識別結果平均比默認參數的v-SVM高31個百分點,證明了它是一種新的具有更好魯棒性的語音識別算法。 ③訂購了國際上公認的語音識別庫TIDigits,建立了500詞漢語孤立詞語音庫,針對各種不同的語音資料庫和低信噪比的情況,驗證了支持向量機的語音識別模型均可成功適用。前期工作表明語音信號特徵提取的方法也直接影響後端識別結果,其中FWDZCPA的效果較優,尤其是在低信噪比0dB的情況下,識別率仍能高於90%,體現了很強的抗噪性。 ④此外還研究了一些相關的工作,例如:基於人耳聽覺模型的情感語音識別特徵,非特定人魯棒性語音識別中前端濾波器,面向語音情感計算的資料庫的構建與套用研究,人工蜂群算法的收斂性分析等。 本項目的研究成果為SVM在抗噪語音識別中的套用提供了理論基礎,對語音識別系統的實用化具有重要意義。