文本語言表達到概念關係的映射方法研究與資源建設

《文本語言表達到概念關係的映射方法研究與資源建設》是依託北京大學,由穗志方擔任負責人的面上項目。

基本介紹

  • 中文名:文本語言表達到概念關係的映射方法研究與資源建設
  • 項目負責人:穗志方
  • 項目類別:面上項目
  • 依託單位:北京大學
項目摘要,結題摘要,

項目摘要

網際網路的智慧型化需求使知識工程日益受到工業界和學術界的高度關注。與DBpedia、Knowledge Graph、YAGO等基於結構化資源的知識工程相比,文本知識工程的困難在於:在非結構化的自然語言文本與概念知識之間存在鴻溝。如何從文本的語言表達映射到概念知識?本申請在語言學和認知語言學理論的指導下,研究語言表達到概念關係之間的映射方法,並建立映射資源。主要內容包括:(1)用物性結構和論旨結構分別建模名詞和動詞的概念語義,研究建立語言表達到概念關係的映射框架;(2)基於名詞語義和動詞語義的相互關聯,挖掘語言蘊含的知識含義,連結語言知識庫和世界知識庫,建立語言表達-概念關係映射基礎集;(3)通過動詞語義聚類和概念關係歸類,研究語言表達如何反映概念知識以及概念知識在語言中如何表示這兩個相互對應的問題,實現語言-知識互學習,擴大映射資源規模。本研究將為中文文本知識工程提供關鍵技術與基礎資源。

結題摘要

自然語言理解的一項突出困難是:在非結構化的自然語言文本表示與認知層面的概念知識之間存在鴻溝。自然語言理解迫切需要建立從表層語言單位到深層認知概念層面的映射關係。本項目圍繞自然語言文本表達與概念關係的映射進行深入研究。主要研究工作包括:融合語言表達與概念關係的中文深層語義描述體系設計,基於多源異構信息的知識獲取方法研究、基於多策略的異構知識映射方法研究、融合語言表達與概念關係的中文深層語義知識資源構建。課題組按項目預訂的計畫進行,並圓滿完成了課題任務書預訂的各項指標,在理論模型、關鍵技術、核心軟體、基礎資源等方面取得了一系列研究成果。在方法層面:提出了從自然語言文本表達映射到概念關係的系列方法,包括基於多源異構信息的知識獲取系列方法和多策略的異構知識映射系列方法,共發表高水平學術論文32篇,其中,在自然語言處理領域頂級會議(ACL,IJCAI,EMNLP,COLING)發表學術論文17篇,申請專利1項。在資源層面:制訂了融合語言表達與概念關係的中文深層語義描述體系,構建了融合語言表達與概念關係的中文深層語義知識資源,形成了12萬字的精加工深層語義標註資源。突破了淺層語義分析的局限性,實現了從表層語言單位到“概念—框架—情境”的認知層面的映射。在人才培養方面:培養博士研究生4名,碩士研究生8名,其中多位學生獲國際會議最佳論文獎及多個學術機構的學術創新獎等獎勵。本課題骨幹教師袁毓林教授獲聘教育部長江學者特聘教授、國家萬人計畫領軍人才。本項目研究成果為中文自然語言理解及文本知識工程提供關鍵技術與基礎資源。

相關詞條

熱門詞條

聯絡我們