文本推理

文本推理表示構造文本的某種表示,以便在這種表示之上,能夠通過相應的計算獲取句子的隱式涵義以及句間的隱式聯繫。

基本介紹

  • 中文名:文本推理
  • 外文名:Textual  Inference
  • 詞類:表述詞語
定義,主要表現形式,研究難點,

定義

在網路信息爆炸婆妹的今天,文本推理顯得越來越重要,它已經成為文本理解、集聚分析、文摘生成、信息提取以及其他諸多自然語言處理套用的核心問題。實際上,早在1986 年,Schank就指出:“自然語言處理中最重要的問題是推理。”

主要表現形式

文本推理基本呈現如下三種形式:
第一種是藉助謂詞邏輯實現反演或其他機制。當所需信息完整時,該方法能夠得出正確結論刪晚講,但不幸的是,自然跨良連語言本身就存在模糊性和歧義性,這就決定謂詞邏輯很難從根本上解決文本推理問題。
第二種方法以框架或腳本為結構組織知識,推理採用模式匹配的方式,輔以其他查詢和匹配的技巧。為了克服這種知識表示結構的死板性,Schank提出目標、規劃,並利用記憶組織包(MOP)結合目標和規劃的信息,對更高更抽象層次上的事件預期進行編碼。儘管如此,使用這估邀腳蘭些結構的系統仍處於“玩具”階段,只能實現幾芝笑戰姜個有限故事文本的推理,究其原因在於無論是框架、腳本、規劃、目標,還是記憶組織包,都與特定的故事文本相關,而故事情節千變萬化,“記憶”中不可能囊括所有的故事。
第三種方法是拘艱芝在概念節點網路中傳遞符號標記,標記的傳播最終會在輸入的不同概念間形成路徑,所有這些路徑以某種方式暗示輸入文本的各種可能解釋,抽取推理即獲取有意義的解釋,這就是人工智慧中所說的“標記傳遞”。該方法的優點是可以並行生成所有的解釋,缺點在於隨著網路變大,路徑數量急劇增多,選擇最佳解釋的代價越來越昂貴。淚海應

研究難點

1、大量背景知識的支持
Beijing [located in] China
Barack [president of] America
EU=European Union Canada[unknown] European

2、句式結構的多樣化
X acquire Y <>Y acquire X
X acquire Y [unknown] X bought Z

3、自然語言處理工具的局限性
詞性標註
命名實體識別
實體消解

相關詞條

熱門詞條

聯絡我們