噪聲和短語音條件下的說話人識別

《噪聲和短語音條件下的說話人識別》是依託清華大學,由張衛強擔任項目負責人的面上項目。

基本介紹

  • 中文名:噪聲和短語音條件下的說話人識別
  • 依託單位:清華大學
  • 項目負責人:張衛強
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

本項目結合文本無關的說話人識別,針對噪聲和短語音進行創新研究,這是當前說話人識別系統所面臨的瓶頸問題。本項目從聲紋專家鑑定的過程得到啟發,擬在特徵、分類器、數據對準和子空間建模等方面進行理論和方法上的創新。具體研究內容包括:(1)研究新型的抗噪聽感知特徵,提高特徵的抗噪能力。(2)研究多解析度時頻特徵,在時頻解析度方面提供多種信息。(3)研究多特徵融合,在特徵層面取長補短。(4)研究噪聲禁止核方法,提高模型的抗噪能力。(5)研究多尺度核,提高模型多尺度匹配能力。(6)研究多核學習,最佳化核函式的選擇與組合。(7)研究多級別數據對準,藉助語音識別在不同級別顯式地將相同的內容對準。(8)研究多層次子空間,採用張量分析在不同層次隱式地將相似的內容共享。通過以上研究成果,提高噪聲和短語音條件下說話人識別系統的識別率和穩健性,有效解決理論研究和實際套用中需要突破的核心技術和關鍵問題。

結題摘要

噪聲和短語音是目前說話人識別技術走向實用的兩大瓶頸,本項目針對這兩大瓶頸問題進行研究。在特徵層面,採用抗噪聽感知特徵和多解析度特徵;分類器方面,採用噪聲禁止核和多尺度核;在進行對比時,藉助語音識別在不同級別顯式地將相同的內容對準,並利用子空間技術在不同層次隱式地將相似的內容共享,使模型可以根據數據量自動調整。通過以上研究成果,提高噪聲和短語音條件下說話人識別系統的識別率和穩健性,有效解決理論研究和實際套用中需要突破的核心技術和關鍵問題。本項目三項專利已經進行了成果轉化,部分成果已在國內某單位實際套用系統,解決了國家的重大需求。

相關詞條

熱門詞條

聯絡我們