特定領域實體關係獲取與實體連結

特定領域實體關係獲取與實體連結

《特定領域實體關係獲取與實體連結》是依託昆明理工大學,由郭劍毅擔任項目負責人的地區科學基金項目。

基本介紹

  • 中文名:特定領域實體關係獲取與實體連結
  • 項目類別:地區科學基金項目
  • 項目負責人:郭劍毅
  • 依託單位:昆明理工大學
項目摘要,結題摘要,

項目摘要

特定領域實體關係的獲取與實體連結是領域知識庫構建中的關鍵部分和難點,也是領域知識圖譜走向套用的基礎。本課題以中文為對象,研究能有效處理特定領域知識圖譜構建所面臨的領域概念層級關係、實體關係獲取和實體連結等關鍵技術。在領域概念層級關係獲取方面,提出融合LDA和MLN模型的方法,利用主題模型發現領域主題及概念的分布候選特徵集,再利用MLN關聯特徵的優勢識別出實體層級關係;在領域實體關係學習方面,提出基於深度信任網並融合領域知識的實體關係深度學習方法,能夠解決領域複雜樣本的關係抽取問題且不依賴人工選擇特徵;在領域實體連線方面,提出基於機率軟邏輯模型的實體連結方法,通過對領域知識和實體屬性等相關特徵建模,聯合這些知識對歧義實體消歧,實現領域實體的知識庫連結,研究成果將用於領域知識庫學習平台,有助於推動領域知識圖譜構建與套用。

結題摘要

項目面向特定領域實體關係的獲取與實體連結的關鍵問題,圍繞領域概念層級關係,領域實體關係學習及領域實體連結等方面開展深入研究,取得以下成果:在領域概念層級關係識別方面,針對複雜命名實體識別問題,提出一種基於最大熵模型的命名實體識別方法,為開展領域層級關係研究提供了技術支撐,針對中文複雜句中實體上下位關係抽取困難的問題,提出基於CRFs的多特徵模板實體上下位關係識別方法,根據領域上下位概念實體語義、語法相近的特性,提出一種結合詞向量和Bootstrapping的領域實體上下位關係的識別方法。在領域實體屬性關係抽取方面,針對人工選取分類特徵困難的問題,提出基於深度信念網路的領域實體屬性關係抽取方法,實現分類特徵自動抽取;針對特定領域實體屬性關係識別中的知識遷移問題,提出融合FastText詞向量和字向量的基於雙向GRU遠程監督的中文領域實體屬性關係抽取方法;在領域實體關係抽取方面,針對不同核函式對相同特徵的抽取性能差異性的問題,提出多核函式融合的領域實體關係抽取方法;針對領域實體關係數據標註困難的問題,提出融合多特徵的遠程監督抽取領域實體關係方法。在領域實體連結方面,針對傳統詞向量一詞多義的問題,結合文檔上下文信息,提出融合詞向量和主題模型的領域實體消歧方法;針對中文實體一對一的實體連結效率低的問題,提出一種融合詞向量的主題圖模型及語義重要性排序的中文集成實體連結方法;針對領域實體連結缺乏領域知識信息的問題,提出了基於關係指數和表示學習的領域集成實體連結方法。基於以上成果,構建涵蓋旅遊景點、野生菌、茶葉、中國及雲南少數民族、小吃、藥材、交通方式和住宿等7大領域的知識圖譜原型。項目在國內外核心期刊或會議發表論文13篇,其中EI收錄5篇,申請發明專利9項,其中授權2項。研究成果將為領域知識圖譜構建提供技術支撐。

相關詞條

熱門詞條

聯絡我們