《事件本體形式化方法中的幾個重要問題》是依託上海大學,由劉宗田擔任項目負責人的面上項目。
基本介紹
- 中文名:事件本體形式化方法中的幾個重要問題
- 項目類別:面上項目
- 項目負責人:劉宗田
- 依託單位:上海大學
中文摘要,結題摘要,
中文摘要
在已提出的事件本體模型的基礎上,集中研究事件本體中的形式化問題。對於事件類的對象、動作、時間和環境等要素,採用形式語言、標度規範、形式概念分析、語法制導等技術,分別解決。對於語言表現要素,採用機器學習技術,針對各個事件類,從中文文本語料中提取語言規律,半自動地綜合成為事件本體中的語言表現規則。對於斷言要素,參照Hoare邏輯,構造事件歸納表達式,對應於事件類之間的各種組成關係,構造相應的推理規則,形成推理體系。對於事件本體中的不確定性和不精確性問題,嘗試相對簡單的模態擴展和量詞擴展,將事件本體中的不確定和不精確成分近似映射到擴展邏輯上,實現不確定性推理。這項研究對於完善事件本體模型起到關鍵的作用,將使事件本體具有更強的推理功能,充分體現事件本體的優越,為建立實用規模的開放事件本體奠定基礎。
結題摘要
事件作為人類知識基本單元,包含了豐富的語義信息。通過事件來研究自然語言處理技術,更接近人類的理解以及認知方式。由於文本中的事件都是由自然語言描述的,這給計算機分析理解事件帶來了困難。因此通過形式化方式構建一個以事件類作為基本單元的本體,成為基於事件的自然語言處理的關鍵,雖然相關研究早已展開,但仍然存在很多問題,主要表現在以下幾點:1.由於事件本體的研究尚處於起步階段,事件本體的形式化表示模型還有待完善;2.對事件本體中各要素的形式化方法還需完善,特別是對事件動態性的表示;3.不同事件類的語言表現規律有待挖掘;4.事件本體中知識的不確定性表示急待研究。本項目詳細地分析了現有的相關研究,針對事件本體形式化中的若干關鍵技術提出了自己的研究思路,取得了一系列的研究成果,主要包括:(1)提出基於框架的概念代數的事件和事件類表示方法,同時對事件的對象、環境、時間、動作等要素進行了基於概念代數的形式化研究;(2)提出基於描述邏輯和要素投影的事件本體形式化方法,該方法統一了事件與事件狀態的表示方法,建立起事件之間、事件要素之間的語義關係;(3)提出基於Z語言的事件類斷言要素的形式化方法,描述事件發生前到事件發生後的狀態變化,充分體現出事件的動態性特點;(4)提出了事件類語言表現規則與模式發現方法,該方法使用Apriori算法發現事件類語言表現的核心詞關聯規則,在語義依存分析的基礎上,使用PETreeMiner頻繁子樹挖掘算法,挖掘事件語言表現核心詞搭配模式;(5)提出基於斷言要素的推理方法,其結合事件本體的特點,擴展了 Hoare 邏輯,使得其順序串聯推理規則能夠滿足不確定的兩個事件之間的關聯,通過分析給出了判斷兩個事件類關聯的方法,展示了事件類之間順序串聯推理的可行性。(6)在事件本體的套用上,提出了基於共現事件的事件網路研究,事件關係網路研究以及基於事件關係的文本摘要自動抽取。(7)提出了基於深度學習的文本事件識別方法,給出了兩種不同的深度學習模型,較好的提高了模型的識別效果,同時算法複雜度較低。