基於結構建模的語音理解及套用研究

基於結構建模的語音理解及套用研究

《基於結構建模的語音理解及套用研究》是依託東莞理工學院,由張劍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於結構建模的語音理解及套用研究
  • 項目類別:青年科學基金項目
  • 項目負責人:張劍
  • 依託單位:東莞理工學院
項目摘要,結題摘要,

項目摘要

近年來發展的語音理解是建立在語音識別和自然語言理解之上的新興研究領域。本項目主要研究基於結構建模的語音理解與摘要技術,以能夠幫助人們從語音文檔中抽取出隱含的結構信息,更快速準確地理解語音文檔,已成為本領域研究熱點和前沿。由於語音識別技術的不完善,所生成文本含有不準確之處,對傳統的基於文本結構建模是極大的挑戰。針對此問題,本項目將在特徵提取、模型算法及套用方面,在現有工作基礎上進行深入研究:分析深層次語音文檔結構,尋找對抽取語音文檔結構幫助更大的新特徵;套用不同的機器學習算法,提高抽取語音文檔結構的性能,並運用抽取的結構信息,改善語音理解與摘要抽取的性能;將新算法套用於演講語音領域。通過本項目的研究,一方面能夠建立更有效的針對深層次語音文檔結構建模的新算法,提高抽取語音摘要的性能與效率;另一方面基於結構建模的語音理解為海量語音文檔管理與安全提供更好的理論支持與實用途徑。

結題摘要

本項目主要研究了基於結構建模的語音理解與摘要技術,用於幫助人們從語音文檔中抽取出隱含的結構信息,更快速準確地理解語音,該研究問題已成為本領域的研究熱點和前沿。 本項目從特徵提取、模型算法及套用等方面進行了深入的研究。主要研究成果如下:(1)對有關語音理解及摘要提取的最新研究文獻進行了廣泛的調研與深入考察;(2)研究了在不同文體的語音資料庫上的語音理解與摘要算法的性能,並比較了各類特徵的作用。在不同形式的兩類語音文檔:中文廣播語音文檔和粵語會議語音文檔,進行了評測實驗。結果顯示:在進行中文廣播語音文檔摘要提取實驗中,結構信息特徵要優於文法信息特徵。這是由於廣播新聞語音文檔潛在的結構信息相對穩定;(3)比較了不同機器學習算法基於不同特徵所構建摘要模型的性能表現。所得到性能最優的摘要模型其性能於中文廣播新聞文檔實驗中,達到0.682 ROUGE-L F-measure,而於粵語會議文檔實驗中,達到了0.737 ROUGE-L F-measure,均屬國際水平。此外,在粵語會議文檔摘要抽取實驗中,基於自動語音識別率僅為73%的語音抄本,所構建的摘要模型仍然能達到0.729 ROUGE-L F-measure的高水平;(4)對文本信息特徵中所使用的詞條權重算法進行了全面性能比較,並將生成的不同的文本信息特徵用於自動語音摘要實驗中進行評測。比較了多種不同的無監督和有監督學習的詞條權重算法,並將不同算法所生成文本特徵,通過最大票數策略進行了綜合套用,以構建最有效的摘要模型。實驗結果表明該策略有效。同時發現Term Relevance Ratio方法所生成的文本信息特徵,能構建出最優的摘要模型。 通過本項目的研究,一方面建立了更有效的針對深層次語音文檔結構建模的新算法,提高了抽取語音摘要的性能與效率;另一方面對於將該算法套用于海量語音文檔的理解以及組織管理方面,提供了更好的理論支持與實用途徑,並做了實驗驗證。

相關詞條

熱門詞條

聯絡我們