基於深度神經網路的實體關係抽取關鍵技術研究

基於深度神經網路的實體關係抽取關鍵技術研究

《基於深度神經網路的實體關係抽取關鍵技術研究》是依託長沙理工大學,由曾道建擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於深度神經網路的實體關係抽取關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:曾道建
  • 依託單位:長沙理工大學
項目摘要,結題摘要,

項目摘要

作為自動構建大規模知識庫的一項核心技術,實體關係抽取對人工智慧的發展有著重要的意義。深度神經網路的快速發展為實體關係抽取帶來了新的思路,本申請課題針對傳統實體關係抽取方法存在的缺點,以構建大規模的、快速更新的知識庫為目標,以非結構化文本為抽取對象,研究基於深度神經網路的實體關係抽取中的關鍵技術,具體研究內容包括:1)針對傳統特徵魯棒性較差,研究使用深度神經網路進行實體關係抽取方法,通過深度神經網路自動學習更具魯棒性的特徵,儘可能少地依賴現有的自然語言處理工具;2)針對弱監督實體關係抽取方法存在數據回標噪聲,研究怎樣在基於深度神經網路的實體關係抽取框架下解決此問題;3)針對深度神經網路對於專家知識的自動學習能力有限,研究怎樣進行多源信息融合以提升實體關係抽取的效果。本申請課題的研究成果將為自然語言理解、網際網路信息深度計算等提供參考。

結題摘要

作為自動構建大規模知識庫的一項核心技術,實體關係抽取對人工智慧的發展有著重要的意義。深度神經網路的快速發展為實體關係抽取帶來了新的思路,本項目針對傳統實體關係抽取方法存在的缺點,以構建大規模的、快速更新的知識庫為目標,以非結構化文本為抽取對象,研究基於深度神經網路的實體關係抽取中的關鍵技術,具體研究內容包括:1)針對傳統特徵魯棒性較差,研究使用深度神經網路進行實體關係抽取方法,通過深度神經網路自動學習更具魯棒性的特徵,儘可能少地依賴現有的自然語言處理工具。2)針對弱監督實體關係抽取方法存在數據回標噪聲,研究怎樣在基於深度神經網路的實體關係抽取框架下解決此問題。3)針對深度神經網路對於專家知識的自動學習能力有限,研究怎樣進行多源信息融合以提升實體關係抽取的效果。在資助期間,這三點研究計畫均取得一定成果,通過對這三點的研究,實體關係抽取性能有了較大的提升。具體地,課題組提出基於代價敏感和排序損失的弱監督實體關係抽取方法,使用代價敏感來解決弱監督實體關係抽取存在的數據不均衡問題。提出了使用生成對抗網路提升弱監督實體關係抽取的性能,自動生成高質量的負樣本。探討實體關係聯合抽取方法,並進行了初步嘗試,取得了較好的效果。本課題解決了從非結構化文本中進行實體關係學習、大規模複雜網路知識的深度挖掘和多源異構知識融合的問題。整體來看,通過三年的努力,已完成項目目標。

相關詞條

熱門詞條

聯絡我們