基本介紹
- 中文名:消除歧義
- 外文名:disambiguation或word sense disambiguation
- 含義:指消除不正確的解釋、理解
定義,消除方法,重要性,
定義
消除歧義(disambiguation)也稱作詞義釐清(word sense disambiguation)或文本消歧(text disambiguation),它是解釋使用一詞多義或多形的詞時作者的使用意圖。
消除方法
既然消除歧義(disambiguation)對人類來說很困難,就可以理解電腦在這方面遇到的麻煩了。對於某些程式,如把口頭語言記錄成書寫語言的醫療錄入套用,或是把鍵入文本翻譯成人類言語的輔助技術,一詞多義或多形都將是一個挑戰。有兩種普遍的方法能進行歧義消除:淺顯法和深入法。
淺顯方法通過前後詞義來確定作者原意,這是比較常見的方法。儘管它相當準確,這個方法並不總是可靠,尤其是同一個檔案中有多個多義詞的時候。雖然如此,這個方法是最容易執行的一種。
深入方法在詞義方面看得更遠,從字典和百科全書中舉證來確定一個詞義的所有可能性。儘管這是消除歧義更為精確的方法,它執行起來並不簡單,主要是因為執行高準確度任務的足夠全面的資料庫(database)很難創建。當使用較小、不夠全面的資料庫時,結果可能不那么準確了。
算法對文本消歧也很實用。複雜的人工智慧算法能設計用來搜尋周圍句子,或者甚至是整個檔案,來發現能指出特定詞原意的詞。由於大部分詞在一個給定檔案中一般只有一個給定意義,這很合理地成為準確的方法。