中文社交化短文本情感分析與話題挖掘研究

《中文社交化短文本情感分析與話題挖掘研究》是依託北京航空航天大學,由王德慶擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:中文社交化短文本情感分析與話題挖掘研究
  • 依託單位:北京航空航天大學
  • 項目負責人:王德慶
  • 項目類別:青年科學基金項目
項目摘要,結題摘要,

項目摘要

面向大規模文本的情感分析與話題挖掘一直以來都是商務智慧型領域的核心研究問題。隨著社交媒體的迅速發展,用戶對某一產品、新聞事件或生活體驗的評價越來越豐富。這些社交化短文本的海量、高維、高稀疏特點以及中文語料的匱乏對傳統的情感分析和話題挖掘算法提出了嚴峻的挑戰。本項目嘗試採用跨語言的情感分析和軟正交約束的非負矩陣分解技術來解決上述問題。具體包括:(1)針對社交短文本高稀疏的特點,將詞語共現矩陣和正交化相結合,研究大規模短文本的非監督特徵選擇問題;(2)利用現有的、豐富的英文情感語料和結構對應學習算法,研究並提出空間遷移的跨語言短文本半監督情感分類算法;(3)針對傳統方法挖掘的話題語義內聚性不強及指示詞不突出問題,引入軟正交約束,研究基於非負矩陣分解的短文本話題挖掘算法;(4)研發系統原型,並針對產品-用戶微博評論展開套用研究。本項目將為社會化媒體環境下的商務智慧型理論與實踐提供有益參考。

結題摘要

大規模文本的情感分析與話題挖掘是產品評論領域的研究熱點,本項目主要利用遷移學習和非負矩陣分解技術來解決現有的問題。具體成果包括:(1)研究並提出一種基於隨機投影和GS的特徵選擇算法,並在大規模短文本數據集上進行了實驗的驗證;(2)利用現有的、豐富的英文情感語料和結構對應學習算法,研究並提出一種軟關聯的遷移學習算法,解決跨領域或者跨語言的產品評論情感分類問題;(3)提出一種互補的方面級觀點挖掘算法,為產品評論意見挖掘提供支持;(4)提出一種基於稀疏表示的軟正交約束的非負矩陣分解的層次主題算法,實現文本數據的層級話題分析。本項目的成果為社會化媒體環境下的商務智慧型理論與實踐提供有益參考。

相關詞條

熱門詞條

聯絡我們