《基於動作概念的本體知識庫及在文本處理上的套用》是依託上海交通大學,由朱其立擔任項目負責人的面上項目。
基本介紹
- 中文名:基於動作概念的本體知識庫及在文本處理上的套用
- 項目類別:面上項目
- 項目負責人:朱其立
- 依託單位:上海交通大學
項目摘要,結題摘要,
項目摘要
海量的線上和線下自然語言文本數據中蘊藏著非常有價值的信息。知識是理解和處理文本數據的關鍵。過去,人們用手工或自動的方法構建了詞典、詞庫和基於名詞的分類知識庫或本體知識庫。但是僅靠名詞和名詞短語來理解文本是不夠的。這是因為動詞或廣義上的動作在每個語句的語義中都起著關鍵作用。近年來語義角色標註(SRL)的研究試圖自動地監測出語句中動詞和它的參數的含義,但是這些監督式學習方法依賴人工編纂的語料,故而難以擴展。本項目中我們將謂語動詞和動作看作一種概念,研究動作概念的理論以及如何從海量網際網路數據上自動提取並構建一個以動作為中心的本體概念知識庫。這一知識庫可以掌握比SRL更細粒度、更廣泛的動作語義。我們還將設計一種把動作自動映射到一個名詞概念上的方法。這一過程被稱為動作概念化。最後我們將在這些新技術的基礎上開發若干經典文本處理套用,以展示動作概念知識庫的用途和性能。
結題摘要
海量的線上和線下自然語言文本數據中蘊藏著非常有價值的信息。知識是理解和處理文本數據的關鍵。過去,人們用手工或自動的方法構建了詞典、詞庫和基於名詞的分類知識庫或本體知識庫。但是僅靠名詞和名詞短語來理解文本是不夠的。這是因為動詞或廣義上的動作在每個語句的語義中都起著關鍵作用。近年來語義角色標註(SRL)的研究試圖自動地監測出語句中動詞和它的參數的含義,但是這些監督式學習方法依賴人工編纂的語料,故而難以擴展。本項目中我們將謂語動詞和動作看作一種概念,研究動作概念的理論以及如何從海量網際網路數據上自動提取並構建一個以動作為中心的本體概念知識庫。這一知識庫可以掌握比SRL更細粒度、更廣泛的動作語義。我們還設計一種把動作自動映射到一個名詞概念上的方法。這一過程被稱為動作概念化。最後我們將在這些新技術的基礎上開發若干經典文本處理套用,以展示動作概念知識庫的用途和性能。在本項目中,我們對數千個英文動詞的參數作了概念化處理,並獲得相當高準確度的參數概念集合。這項成果發表在AAAI 2016,並公開了我們的數據集和開原始碼。