消除歧義

消除歧義(disambiguation)也稱作詞義釐清(word sense disambiguation)或文本消歧(text disambiguation),它是解釋使用一詞多義或多形的詞時作者的使用意圖

基本介紹

  • 中文名:消除歧義
  • 外文名:disambiguation或word sense disambiguation
  • 含義:指消除不正確的解釋、理解
消除方法,重要性,

消除方法

既然消除歧義(disambiguation)對人類來說很困難,就可以理解電腦在這方面遇到的麻煩了。對於某些程式,如把口頭語言記錄成書寫語言的醫療錄入套用,或是把鍵入文本翻譯成人類言語的輔助技術,一詞多義或多形都將是一個挑戰。有兩種普遍的方法能進行歧義消除:淺顯法和深入法。
淺顯方法通過前後詞義來確定作者原意,這是比較常見的方法。儘管它相當準確,這個方法並不總是可靠,尤其是同一個檔案中有多個多義詞的時候。雖然如此,這個方法是最容易執行的一種。
深入方法在詞義方面看得更遠,從字典和百科全書中舉證來確定一個詞義的所有可能性。儘管這是消除歧義更為精確的方法,它執行起來並不簡單,主要是因為執行高準確度任務的足夠全面的資料庫(database)很難創建。當使用較小、不夠全面的資料庫時,結果可能不那么準確了。
算法對文本消歧也很實用。複雜的人工智慧算法能設計用來搜尋周圍句子,或者甚至是整個檔案,來發現能指出特定詞原意的詞。由於大部分詞在一個給定檔案中一般只有一個給定意義,這很合理地成為準確的方法。

重要性

這不是一項簡單的任務,消除歧義(disambiguation)對所有語言處理都很重要。任何軟體,如利用語音識別或文本語音轉化的軟體,必須使用幾種消除歧義策略來得到準確結果。消除歧義在非結構化數據(unstructured data)中也很重要,如在電子郵件、檔案、 即時信息和Twitter客戶端中產生的那些。

相關詞條

熱門詞條

聯絡我們