唇讀

唇讀

唇讀(lip—reading/speech—reading),可以通過觀察說話者的口型變化,“讀出”或“部分讀出”其所說的內容。唇讀研究的目的是利用視覺信道信息補充聽覺信道信息,提高計算機系統的理解力。英國科學家已研製出可以分辨不同語言的唇讀計算機,能夠識別英語法語德語阿拉伯語漢語國語粵語義大利語波蘭語俄語等語種。這項技術對耳聾患者、執法機構以及嘈雜環境中的工作者具有實際套用意義。

基本介紹

  • 中文名:唇讀
  • 外文名:lip—reading/speech—reading
概述
唇讀
英國科學家已研製出可以分辨不同語言的唇讀計算機。其實研究人員一直在開發可以讀唇語的計算機,但是它們被“教會”識別各種語言還是第一次。科學家指出,這項發明對耳聾患者、執法機構以及嘈雜環境中的工作者具有實際套用意義。
這項研究由英國東安格利亞大學計算機科學學院的Stephen Cox和Jake Newman指導完成。該技術是通過對23位掌握兩種或三種語言的人的唇部動作進行統計建模而開發的。該系統能夠識別單個講話者所說的語言,而且具有很高的準確性。這些語言包括英語、法語、德語、阿拉伯語、漢語國語及粵語、義大利語、波蘭語和俄語和日語。
Cox表示:“這是自動唇讀技術的一次令人激動的進步,它第一次科學地證實了我們已有的直觀推斷,即當人們講不同的語言時,他們會以不同的順序出現不同的唇形。”Cox介紹說,“例如,我們發現講法語的人較常出現圓唇形,而講阿拉伯語的人具有很明顯的舌部動作。” Cox補充說:“多年來,科學家一直在進行語音和語言處理法則的基礎研究,比如噪音中的語音識別、公式化語言建模、由語音合成所做的語言處理以及語音處理套用的開發。”
據研究人員介紹,自動唇讀技術中蘊含著許多科學挑戰。現已經解決了其中的幾個主要科學問題,包括面部動作與感知語音之間是什麼關係;講話者的語言以及談話內容如何影響這種關係;語言、講話者的姿勢以及談話內容對識別準確度有什麼影響等。
這項研究屬於一個更寬泛的自動唇讀項目中的一部分。該項目將建立在先進的計算機視頻和語音識別技術之上,對視頻中的自動唇讀進行研究和評估,從而開發能夠對來自視頻中的目標進行自動、語言獨立唇讀的工具和技術。該項目還尋求量化人類以及自動機器的能力。研究人員下一步將使這個系統更加適合個人生理學,以及人們說話的方式。

相關詞條

熱門詞條

聯絡我們