面向大規模知識圖譜的弱監督中文實體關係抽取研究

面向大規模知識圖譜的弱監督中文實體關係抽取研究

《面向大規模知識圖譜的弱監督中文實體關係抽取研究》是依託華中師範大學,由周光有擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向大規模知識圖譜的弱監督中文實體關係抽取研究
  • 項目類別:面上項目
  • 項目負責人:周光有
  • 依託單位:華中師範大學
項目摘要,結題摘要,

項目摘要

實體關係抽取是自然語言處理和信息抽取領域的重要研究課題,然而傳統的面向ACE的有監督實體關係抽取需要大規模的人工標註語料庫作為訓練數據,因而通用性不強,無法滿足實際套用需求。近年來,隨著大規模知識圖譜的出現,面向知識圖譜的弱監督實體關係抽取受到了相關領域研究人員的高度重視,成為新的研究熱點。本申請課題以大規模中文知識圖譜的填充與有效利用為總目標,從數據資源、特徵表示和理論方法三個層次入手,針對弱監督實體關係抽取的四項關鍵技術展開研究:(1)基於雙語深度學習和語義圖的大規模中文知識圖譜填充與集成;(2)基於協同語義和辭彙語義引導的分散式詞向量表示;(3)基於協同建模與依賴假設的多實例弱監督實體關係抽取;(4)基於聯合實例建模和特徵顯著度排序的弱監督實體關係抽取。以上研究成果一方面可以直接套用於實體關係抽取,提升其抽取的性能;另一方面也為信息抽取技術的發展產生重要影響。

結題摘要

知識圖譜是自然語言處理領域中的熱點課題之一。在實體關係抽取、問答系統、對話系統、知識推理等多個任務中,知識圖譜能夠為各個任務提供豐富的結構化知識。本課題主要研究面向大規模知識圖譜的弱監督中文實體關係抽取,主要研究內容包括:基於深度學習的主題實體抽取、基於知識圖譜的自然語言問答、基於文檔庫的非結構化信息抽取、具有情感監督的開放域對話生成以及融合主題信息的情感對話生成。主要研究成果包括:9篇高水平學術論文,授權國家發明專利5項,相關成果得到了國內外同行的肯定,推動了該領域的發展。

相關詞條

熱門詞條

聯絡我們