網路輿情信息中事件篇章關係檢測方法的研究

網路輿情信息中事件篇章關係檢測方法的研究

《網路輿情信息中事件篇章關係檢測方法的研究》是依託蘇州大學,由姚建民擔任項目負責人的面上項目。

基本介紹

  • 中文名:網路輿情信息中事件篇章關係檢測方法的研究
  • 項目類別:面上項目
  • 項目負責人:姚建民
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

事件篇章關係檢測是信息抽取和輿情分析交叉領域的重要研究課題,對於以事件為主體元素的自然語言邏輯關係抽取,以及藉助關聯事件挖掘輿情信息的衍生線索和發展脈絡,都具有很高的實用價值。目前,事件關係檢測的相關研究較少,尤其藉助篇章分析從語義層面深入解釋和描述事件關係的研究尚屬空白。本課題將重點研究刻畫事件關係的語言學規律,並基於篇章分析,探索事件語義關係的機器學習和自動檢測方法。主要研究內容包含如下四個方面:基於跨實體推理的事件抽取、基於動態話題模型的跨篇章關聯事件識別、基於平行理論的事件篇章關係檢測、事件關係層次作用域的自動構建。特別是研究藉助巨觀話題對事件關係的約束,識別淺層事件關係的方法;以及藉助事件語義平行性識別,利用平行事件參與篇章關係形成過程的語言學共性,檢測事件邏輯關係的數學建模方法。目標是實現針對輿情信息中各類事件邏輯關係的自動識別與檢測,藉以輔助事件衍生與發展的預測與預報。

結題摘要

本課題旨在實現一種面向網路輿情信息的事件篇章關係檢測方法。針對這一目標,計畫研究任務包括:基於跨實體推理的事件抽取方法,基於推理線索的跨篇章關聯事件識別,基於平行理論的事件篇章關係檢測方法,以及事件關係層次作用域構建。根據研究計畫,課題組在為期四年的研究周期中,提出並評測多種研究方法,學術成果得到國際頂級學術會議的認可,構建一套雙語數據集和原型系統多套,基本實現了預期研究目標,總體進展順利。下面對本課題取得的研究成果進行概述。 (一)建立了以分類技術為基礎的自由文本事件抽取方法,形成了一種跨實體推理的事件分類抽取方法,性能優於國際同期相關技術8.6個百分點。此外,課題組基於主題相似度的事件標籤傳播算法實現的事件抽取系統在2015年Event Nugget國際評測中獲得第一的性能。同時,課題組開展了基於深度學習和主動學習的聯合事件抽取方法研究,對事件塊Nugget檢測研究提供了新的思路。目前,課題組著力提升基於重述識別的事件抽取與傳播算法; (二)提出基於推理線索的事件關係識別方法,驗證了事件核心詞,實體以及事件依存線索對事件關係識別的作用。利用篇章結構關係進行事件關係理解,以及利用新型堆學習方法實現關係判定的verification,都是這一工作的亮點。基於ACE語料庫標記事件關係,形成關係書庫一套; (三)開發了雙語平行網頁識別系統,藉助該系統,本課題從Web資源挖掘了3千萬中英雙語平行句對,為多語言事件關係檢測提供大規模的外部資源; (四)建立了以顯式關係推理隱式關係的平行推理技術為基礎的事件篇章關係檢測方法,在此基礎上,針對論元關係的歧義性問題,提出基於焦點識別的歧義關係檢測方法。由此形成的平行推理方法在國際權威數據PDTB上的隱式篇章關係分類任務上,獲得14%的性能提升; (五)構建了一套基於訓練數據擴展的事件篇章關係分類體系,驗證了框架語義知識、語義向量在平行論元對挖掘上的作用,擴充了事件篇章關係分類樣本集; (六)形成一套面向新聞事件的事件專題跟蹤與關聯分析系統,目前已達到初級套用水平。四年來,總計發表文章50餘篇,其中核心和EI論文近40篇;國際頂級會議ACL/EMNLP/COLING等論文5篇;國內一級學報“計算機學報”、“軟體學報”等3篇;受理專利6件,已授權1件,近期投出專利2件。

相關詞條

熱門詞條

聯絡我們