實用漢語語音識別系統的關鍵技術

《實用漢語語音識別系統的關鍵技術》是依託清華大學,由方棣棠擔任項目負責人的專項基金項目。

基本介紹

  • 中文名:實用漢語語音識別系統的關鍵技術
  • 依託單位:清華大學
  • 項目負責人:方棣棠
  • 項目類別:專項基金項目
  • 批准號:61040030
  • 申請代碼:F0605
  • 負責人職稱:教授
  • 研究期限:2011-01-01 至 2011-12-31
  • 支持經費:10(萬元)
項目摘要
語音識別產品不同於實驗室演示系統,能否走向實用取決於在實際套用條件下,滿足用戶的實際需求。首先,訓練集語音樣本必須符合使用時的實際套用條件,也就是在預計使用群體(不同年齡和性別,各種口音)中按預計使用環境(各種電話類型和噪音環境)進行訓練集的語音樣本收集。收集樣本充分覆蓋實際套用條件的方方面面。建立語音識別聲學模型分三個基本部分:特徵抽取、模式化分和時間對準。對於我們選取的語音特徵參數,需要能夠將各類樣本的特徵參數點完全劃分開。對於模式劃分,我們需要在混合高斯分布(GMM)計算最大似然值(ML)和K近鄰法進行比較。對於時間對準,目前還不夠完善,需要認真探索解決。為了認證這一途徑的正確性,我們選擇0-9十個數字加上*和#所有電話機上的十二個鍵作為語音識別系統的識別字表,在實際套用條件下,識別率至少達到99%以上,使做成語音識別產品時真正能夠走向實用。本項目著重研究實用語音識別系統的關鍵技術。

相關詞條

熱門詞條

聯絡我們