自然語言語音理解系統

自然語言語音理解系統,人和計算機之間用自然語言口語語音對話的通信系統。

基本介紹

  • 中文名:自然語言語音理解系統
  • 性質:信息技術術語
沿革,推薦書目,

沿革

從20世紀60年代初開始研究,10多年間一直停留在用模式識別的方法辨認單詞的語音識別,即在計算機里儲存某些單詞的聲學模式,用作匹配輸入的語音信號。由於語音識別無法使計算機辨認連續語流中的語音變化,以及人和人之間、同一個人先後發音之間的差別,也不能排除噪聲干擾,因此效果不大。
70年代初期認識到,必須綜合套用語言學知識來研究計算機對連續語流的語音理解。
1971年美國國防部高級研究計畫中心為語音理解研究設立基金,要求在5年之內取得突破。具體指標是使計算機能理解特定範圍內的正常口語句子(連續語音),單詞不少於1 000,錯誤不超過10%。
到1976年先後建成了一些英語語音理解的實驗系統,它們能在有限的辭彙、句法和特定的主題範圍內理解英語口語句子。其中有代表性的是美國卡爾奈吉–梅隆大學的HEARSAY系統和HARPY系統,BBN公司的HWIM系統。這些系統的設計互不相同,各自採用了特定的技術安排,但總的方法是一致的,即語音、辭彙、句法、語義、語用的分析同時進行,互為補充,以確定輸入句的內容。一般的處理程式是分析輸入語音信號的聲學物理特徵,根據音系規則歸納音位、音位變體、連續音變和語音省略;以切分音節;根據構詞規則作出單詞假設,稱為“底端分析”;套用句法、語義、語用規則和主題知識,根據上下文預測輸入句的內容,稱為“頂端分析”。底端無需識別每一個語音信號,模糊不清的可以跳過;只要能提出句中某幾個單詞的假設,就能由頂端根據詞的搭配、句法組合和主題知識前後左右加以推斷,建立句中單詞序列的一種或幾種假設,再用底端的語音數據核實,擇優選用。這種上下結合的分析方法是一個重要的突破,取得了明顯的效果。據HARPY系統的實驗,底端憑語音數據切分單詞的準確率只有42%,而語音、句法、語義綜合分析的準確率卻高達97%。
70年代後期和80年代初期,語音理解向縱深探索,開始設計某些專用性系統,例如澳大利亞坎培拉高等教育學院信息科學學校正在研製的FOPHO系統,輸入澳大利亞英語口語語音,計算機經過識別、理解能轉寫為音標顯示輸出,為教學和科研服務。
進入21世紀,隨著計算機技術和人工智慧技術的發展,自然語言語音理解系統的研究和套用不斷取得進展,例如系統在電話信道上的成功套用等。關於漢語語音理解的研究,見漢語語音理解系統。

推薦書目

BARRA,FEIGENBAUMEA.TheHandbookofArtificialIntelligence:Vol.1.LosAltos:WilliamKaufman,Inc.,1981.

相關詞條

熱門詞條

聯絡我們