病理嗓音識別及嘶啞嗓音修復研究

病理嗓音識別及嘶啞嗓音修復研究

《病理嗓音識別及嘶啞嗓音修復研究》是依託蘇州大學,由陶智擔任項目負責人的面上項目。

基本介紹

  • 中文名:病理嗓音識別及嘶啞嗓音修復研究
  • 項目類別:面上項目
  • 項目負責人:陶智
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

病理嗓音主要是由於聲帶和喉的各種疾病導致其閉合或振動異常而發生,致使其聲學性質發生改變,在臨床上表現出不同程度的聲音嘶啞、失真等。目前國內外關於這方面的研究側重於正常嗓音與病理嗓音的診斷、分析和評價來輔助醫學治療,並未實現不同病理嗓音種類的精確診斷,也鮮有病理嗓音修複方面的研究。本項目擬研究表征病理嗓音特徵的參數,採用自適應權重分配與支持向量機相結合的算法,實現病理嗓音的細分。並依據基音頻率偏離和共振峰上的能量分布異常,採用小波變換與混沌時間序列經驗模型並結合混合高斯模型算法實現基頻的估計和修正,對共振峰則採用貝葉斯濾波算法進行跟蹤及修正,最終實現病理嗓音的修復。這項研究不僅對嗓音學和喉科學的深入探索有重要的學術意義,並可直接套用於語音通信和語音識別系統等諸多領域,具有廣泛的套用前景。

結題摘要

儘管目前有多種方法用於喉科疾病方面的醫學研究及診斷,但是大都為侵入性的檢查方式,對患者會造成一定的痛苦及損傷。而聲學分析方法通過深入研究嗓音中所包含的各類參數,實現非侵入性識別嗓音疾病,為後續的確診及治療爭取寶貴的時間。通過本項目開展,在病理嗓音非線性特徵提取及最佳化、病理嗓音細分識別及病理嗓音共振峰修復等諸多方面都開展了卓有成效的工作。提出了一種採用感知語譜結構邊界參數(PSSB)的病理嗓音端點檢測算法及感知聽覺場景分析的缺失數據特徵提取方法,實驗表明該方法能夠更有效地檢測出語音的端點及提高語音信號的魯棒性,為在醫院嘈雜的環境下採集病人的嗓音提供了良好的環境基礎。在特徵參數提取方面,所提出的巴克濾波器組及最大李雅普諾夫指數下的非線性特徵提取方法已申請國家發明專利並授權。而將Gammatone聽覺濾波器組和非線性時間序列分析結合提出了MBLLE特徵參數,識別率有了顯著的提高,將MBLLE和最優核函式結合最佳識別率可提升至97.82%。同時通過研究發現目前傳統聲學參數結合模式識別算法對嗓音疾病細分識別率較低,故根據實際發聲機理,提出了一種建立發聲動力學模型輔助息肉和麻痹喉聲源分類的方法。根據最大李雅普諾夫指數隨聲門下壓變化的差異性分布,有助於識別並分類聲帶息肉和聲帶麻痹。此外又通過聲帶動力學模型參數反演方法,從發聲機理角度對聲帶病變嗓音進行有效區分。在嘶啞嗓音修復領域,所提出的擴展型雙線性變換法將嗓音轉換方法有效減小了轉換語音與正常語音的譜失真距離, 進一步提高轉換語音音質和可懂度。而所提出的採用線譜對分段定值偏移的方法,通過實驗表明修正後的線譜對參數較修正前相更接近於正常嗓音。此外,與蘇州大學附屬第一人民醫院合作共建了蘇州大學病理嗓音資料庫,為國內首個較為完整的病理嗓音資料庫,為本項目的實驗樣本需求提供了有力的支撐。

相關詞條

熱門詞條

聯絡我們