漢語耳語音感知中關鍵技術研究

漢語耳語音感知中關鍵技術研究

《漢語耳語音感知中關鍵技術研究》是依託蘇州大學,由陳雪勤擔任項目負責人的專項基金項目。

基本介紹

  • 中文名:漢語耳語音感知中關鍵技術研究
  • 項目類別:專項基金項目
  • 項目負責人:陳雪勤
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

語義是耳語音感知的主要目標。本項目擬研究耳語音感知中特徵表示及模型最佳化方法。本項目根據外圍聽覺通路和聽神經處理機制,提取耳語音聽覺皮層感知譜,並非線性降維得到耳語音拓撲結構低維特徵。提出通過加強拓撲結構時序性和非語義信息抑制的局部保距投影方法提高特徵的區分性和穩健性。提出母親庫、家庭庫、社會庫的語料建庫方式。首先用已標註的母親庫和家庭庫訓練初始聲學模型,進而由初始模型對未標註的社會庫進行識別,根據所設計的符合耳語音特徵的置信度計算方法,選擇低置信度樣本反饋作標註後對模型進行最佳化訓練,達到降低樣本標註工作量和模型區域最佳化的目的。本研究擬建立一個基於聽覺譜非線性降維拓撲結構特徵和反饋式學習模型的漢語耳語音感知實驗系統,並進行測試分析。本研究不僅對聽覺感知理論深入探索有理論意義,而且在物聯網人機互動、安全、醫學等領域有實際套用前景,對正常語音識別以及語音增強也有參考意義。

結題摘要

耳語音是一種特殊的發音模式。人們在某種特定場合下為了避免影響他人而使用耳語進行手機通話,國家安全部門安全保密工作及偵察與反偵察的需要,金融部門保障客戶的私密信息及身份認證的需要,嗓音病人或發音功能不正常者進行的語音交流等。耳語音由於音量低,無基頻,其分析方法有別於正常語音,本項目主要研究數字耳語音識別方法。取得以下研究成果:(1)耳語音的端點檢測是系統識別性能的關鍵環節。根據耳語音的特性,本項目提出一種鄰域極值差分信號功率譜的分形維值算法,用於低信噪比環境下的語音活動檢測。該方法在語音端點檢測和效率兩方面具有良好的綜合性能。(2)耳語音的聲調估計是一個難題。考慮聲道參數與激勵之間的協變關係建立了一個語料一致的耳語音和正常語音資料庫,該資料庫中耳語音和正常語音的說話人、語音內容、語序完全一致。將耳語音的線性預測倒譜參數、正常語音線性預測倒譜參數和基頻參數對齊,將其劃分為40個區間,對每個區間的數據訓練一個高斯混合模型並得到一個估計函式。估計階段,提取耳語音的線性預測倒譜參數,將其與每一個高斯混合模型匹配,搜尋最佳匹配的模型,然後採用該模型的估計函式估計耳語音的F0值。(3)耳語音和正常音的許多不同點,本項目比較了漢語數字正常音和耳語音的聲學特徵,分析了正常音和耳語音的數字區分度,同時建立了一個漢語數字語音識別系統,比較了耳語音和正常音的識別率。在相同特徵的情況下,無論是孤立字之間的區分度還是最終識別率,耳語音的效果都不如正常語音。為改善識別率,根據特徵距離的特點找到數字耳語音中易混淆發音,並進一步採用多級判據進行識別。(4)本項目對耳語音提取聽覺感知頻譜以改善識別率。根據皮層表征模型,對耳語音信號的能量譜在不同尺度和朝向進行卷積並濾波。進一步對特徵做稀疏平均和降維,此特徵可保留信號聽覺譜的拓撲結構,對於數字耳語音識別率有比較明顯的改善。

相關詞條

熱門詞條

聯絡我們