面向文本推理的漢語語義計算模型研究

《面向文本推理的漢語語義計算模型研究》是依託北京大學,由李素建擔任負責人的重大研究計畫。

基本介紹

  • 中文名:面向文本推理的漢語語義計算模型研究
  • 項目負責人:李素建
  • 依託單位:北京大學
  • 項目類別:重大研究計畫
項目摘要,結題摘要,

項目摘要

文本語義推理是近幾年出現的一個新方向,並迅速成為了研究的熱點問題。本項目的研究目的是,充分利用已有的語言資源,圍繞文本語義推理問題,從不同層面開展漢語文本的語義計算研究,以期建立漢語文本語義推理的基本框架。研究內容主要包括如下四個方面:(1)研究辭彙的概念語義關係的分析方法。重點分析文本中名詞(短語)概念以及概念關係,建立指代詞與先行詞之間的關聯;確立縮略語與原形語之間的關聯,從而將文本構造成若干個可替換的詞集;為基於辭彙替換的推理服務;(2)研究句子語義的統一表示形式。在語義角色標註的基礎上,將句子變換成謂詞-變元的表示;(3)研究基於謂詞的語義關係自動獲取方式,利用複述技術和交叉度計算方法,分析謂詞之間的語義關係,獲取語義關係,為基於謂詞替換的推理提供靜態的知識源;(4)研究基於邏輯和基於機率的兩種推理框架,使之既可適應精確推理,又可適應模糊推理。

結題摘要

課題圍繞辭彙層、語句層、篇章層三個層次對漢語文本語義推理的方法及其套用展開了研究,三年來的主要進展歸納為如下三方面:(1)在辭彙層研究概念語義關係的分析方法。重點在於確立縮略語與原形語之間的關聯,為基於辭彙替換的推理服務;(2)在語句層研究中文文本蘊含的推理模型,將句子間的推理關係劃歸到詞的推理關係上,嘗試規則和機率方法進行推理;(3)在篇章層研究句間和段間修辭關係的分析方法,為在篇章層進行文本推理打下基礎。 課題一直按項目預定的計畫進行,達到了項目預期的目標,並完成了項目預期的研究成果。基於以上研究內容,形成了理論結合實踐、規範和資源共建、技術實用化的一整套比較系統的研究成果。(1)理論成果:相應的研究成果發表國內外會議和期刊上。其中,SCI索引論文3篇,在國際頂級會議ACL,WWW,CIKM,KDD,EMNLP, COLONG共發表論文8篇。同時項目相關的一些研究成果融於綜合型語言知識庫,獲得了中國電子學會電子信息科學技術獎(一等獎)和國家科學技術進步獎(二等獎)。(2)規範和資源建設:收集和挖掘8350對縮略語及其完整形式的對照表;構建和完善了一套篇章標註規範,並在此規範下收集和標註了近百篇新聞文檔和醫學文檔。(3)系統實踐:參加了三屆TAC國際摘要評測;參加了Semeval-2010的關鍵字抽取評測;參加了CIPS-SIGHAN 2010評測的任務4(漢語詞義歸納);參加了NTCIR-9的RITE評測任務(文本蘊含推理);參加了COAE第三屆中文傾向性分析評測的4項任務;組織了CIPS-SIGHAN 2012的實體消歧任務,驗證了我們的研究成果。(4)學術交流:與香港理工大學、北京語言大學、中科院計算技術研究所、中國科學技術信息研究所、IBM研究院等進行學術交流、資源轉讓與技術合作等。(5)人才培養:指導了2名博士生、8名碩士生、6名本科生順利畢業。有2名碩士生獲得優秀碩士論文,多名本科生獲得北京大學信息學院優秀本科畢業論文。

相關詞條

熱門詞條

聯絡我們