跨語言社會輿情分析基礎理論與關鍵技術研究

跨語言社會輿情分析基礎理論與關鍵技術研究

《跨語言社會輿情分析基礎理論與關鍵技術研究》是依託蘇州大學,由周國棟擔任項目負責人的重點項目。

基本介紹

  • 中文名:跨語言社會輿情分析基礎理論與關鍵技術研究
  • 項目類別:重點項目
  • 項目負責人:周國棟
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

跨語言社會輿情分析是智慧型信息處理的一個研究熱點。本項目旨在建立一套適用於跨語言社會輿情分析的理論方法體系,開發一系列關鍵技術,並構建相關資源和實驗平台,解決阻礙其發展的關鍵科學問題。特別是,(1)針對社會輿情的篇章屬性,基於篇章結構和話題結構理論,開展篇章級事件信息抽取研究;(2)針對社會輿情的難預測性、突發性與多變性,基於事件關係網路,實現社會輿情的準確預測、及時發現與快速跟蹤;(3)針對社會輿情的多源異構性,基於貝葉斯網路,開展面向社會輿情的事件可信度計算研究;(4)針對社會輿情傳播的跨語言特性和不同語言資源的不對稱性,探索跨語言推理機制、資源遷移和語義空間等跨語言技術,實現面向社會輿情分析的跨語言信息處理;(5)針對社會群體情感的多面性,基於社會關係網路,開展社會群體情感分析研究;(6)針對資源匱乏問題,基於網際網路大規模自然標註資源、自舉學習和群體智慧,構建相關資源,保障本項目的順利開展。

結題摘要

跨語言社會輿情分析是智慧型信息處理的一個研究熱點。針對其中存在的關鍵科學問題,本項目建立了一套適用於跨語言社會輿情分析的理論方法體系,研發了一系列關鍵技術,標註了各種資源,並構建了相關實驗平台。主要研究包括: (1)篇章級事件信息抽取:基於篇章修辭結構和話題結構理論,針對社會輿情的篇章屬性,系統深入開展了篇章級事件信息抽取相關技術的研究,包括事件抽取、事件關係抽取、實體抽取、實體關係抽取,突破了傳統辭彙級與句子級分析的限制,圍繞輿情事件,為基於篇章級分析的社會輿情分析打下了紮實的基礎。 (2)社會輿情分析:基於社會輿情(傳播效應)認知機理,首先,針對社會輿情的多源異構性,開展了事件可信度計算的研究。其次,針對社會輿情的難預測性、突發性與多變性,開展了社會輿情預測與跟蹤的研究。最後,針對社會群體情感的多面性,系統深入開展了面向社會輿情的社會群體情感分析的研究。 (3)跨語言信息處理:基於自然語言(語義遷移)認知機理,針對社會輿情傳播的跨語言特性和不同語言之間的資源不對稱性,系統深入開展了跨語言信息處理的研究。首先,以跨語言輿情信息融合為目標,研究了多語言環境下自然語言生成技術,包括單語言自動文摘、跨語言自動文摘以及文本自動生成。其次,以跨語言情感分析為目標,研究了跨語言情感分類與觀點抽取,以及面向微博文本的觀點分析。最後,以跨語言輿情信息語義理解為目標,研究了基於圖表征的深層語義分析方法,並研製了高性能深層語義分析器。另外,探索了跨語言實體關係抽取和面向雙語文本的跨語言情感分析。 (4)跨語言社會輿情分析資源和平台構建:在資源匱乏的情況下,面向跨語言社會輿情分析進行了資源與平台構建,構建了單語標註語料資源和雙語對齊語料資源,並集成相關技術,構建了跨語言社會輿情分析平台。同時,圍繞維吾爾語,系統深入研究了面向少數民族語言的自然語言處理和社會輿情分析相關技術,極大地推動了相關研究。

相關詞條

熱門詞條

聯絡我們