面向社會媒體的情感傾向分析方法研究

《面向社會媒體的情感傾向分析方法研究》是依託復旦大學,由張奇擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向社會媒體的情感傾向分析方法研究
  • 依託單位:復旦大學
  • 項目類別:面上項目
  • 項目負責人:張奇
項目摘要,結題摘要,

項目摘要

近年來,以微博、微信等為代表的社會媒體發展迅速。僅新浪微博每天就產生超過1.17 億條訊息。在這些海量的社會媒體數據中,包含了用戶發表的大量關於產品、公司以及事件等方面的評論和觀點。如何能夠快速有效的分析和處理社會媒體中的包含情感傾向的內容,成為了一個亟待解決的重要問題。傳統的基於文本內容的情感傾向分析方法由於缺乏對用戶以及用戶關係、社會媒體環境下話題發現與話題傳播以及上下文信息關聯分析等能力,不能很好的分析這些傳播於複雜社會網路中的流動著的信息。因此,在本項目中我們擬針對上述問題,面向社會媒體數據,針對海量文本內容和結構信息,利用大規模數據處理框架,開展面向社會媒體的的情感傾向分析研究,包括:融合語義與傳播關係的情感傾向語義表示模型;基於結構化學習方法的情感傾向語義自動分析構建算法;評論信息質量判別、用戶權威度分析等。並構建包含社會網路與訊息內容的情感傾向分析標準語料庫。

結題摘要

情感傾向分析是自然語言處理的基礎任務之一,隨著近年來深度學習方法在自然語言處理領域的套用,情感傾向分析任務也受到越來越多的關注。傳統的情感傾向分析通常是以產品評論、電影評論等數據為分析對象,但是以微博、微信等為代表的社會媒體發展迅速。在這些海量的社會媒體數據中,不僅包含了用戶發表的大量關於產品、公司以及事件等方面的評論和觀點。傳統的基於文本內容的情感傾向分析方法由於缺乏對用戶以及用戶關係、社會媒體環境下話題發現與話題傳播以及上下文信息關聯分析等能力,不能很好的分析這些傳播於複雜社會網路中的流動著的信息。如何能夠快速有效的分析和處理社會媒體中的包含情感傾向的內容,成為了一個亟待解決的重要問題。 在本項目中我們針對上述問題,面向社會媒體數據,針對海量文本內容和結構信息,利用大規模數據處理框架,開展面向社會媒體的的情感傾向分析研究,包括:融合語義與傳播關係的語義表示與分析模型;基於結構化學習方法的情感傾向語義自動分析構建算法;基於有監督注意力機制的傾向性分析模型;基於互學習方法的情感傾向領域遷移學習等算法那。同時我們還構建了包含社會網路與訊息內容的情感傾向分析標準語料庫。在本項目的支持下,整個項目周期內完成了全部研究計畫中內容,並發表論文35篇,其中中國計算機學會推薦A類期刊/會議18篇,中國計算機學會推薦 B類期刊/會議15篇,其中發表於COLING 2018 (中國計算機學會推薦 B類會議)論文還獲得最佳論文提名。此外,本項目支持所構建的數據集合,還通過中國中文信息學會向超過200家科研院所發布了。是目前最大微博開發學術數據集合。在本項目的支持下,相關工作還獲得2016年中國中文信息學會“錢偉長科技進步”漢王青年創新一等獎。

相關詞條

熱門詞條

聯絡我們