《微博熱點事件的情感趨勢分析與預測研究》是依託哈爾濱工業大學,由徐冰擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:微博熱點事件的情感趨勢分析與預測研究
- 依託單位:哈爾濱工業大學
- 項目類別:青年科學基金項目
- 項目負責人:徐冰
項目摘要,結題摘要,
項目摘要
隨著社會網路的快速發展,以微博為代表的文本已經成為網際網路信息發布的重要形式,也為民意的分析與預測提供了新的途徑。本課題以中文微博為對象,探索針對熱點事件的情感趨勢分析與預測方法。在綜合獲取各種用戶特徵和文本特徵的基礎上,課題引入深度學習方法進行熱點事件的情感分析,進而以多維情感特徵為基礎對用戶情感趨勢進行量化,最終通過貝葉斯模型綜合多種信息對事件的情感趨勢曲線進行擬合,完成預測建模。從套用角度看,該課題是輿情深入分析的關鍵技術,對於了解經濟活動和社會事件中的人群態度、探索社會群體心理規律具有明顯的實用價值,支持政治、經濟和生活合理決策。從理論上,該課題是對非結構化的社會信息進行多元統計分析和計算的有益嘗試,引入深度學習提高情感分析效果,並採用貝葉斯模型提高趨勢預測效果。
結題摘要
隨著社會網路媒體的快速發展,用戶產生的各種評論性主觀文本的數量迅猛增長,如何快速、高效地對網路媒體上的情感信息進行識別、分類、抽取、判斷,並進一步對用戶的轉發行為和輿情發展趨勢進行準確分析和預測已經成為迫切的社會需求。課題研究主要圍繞如下三個方面展開: 在情感信息分類和情感要素抽取方面,課題組開展了四項研究:基於聯合深度學習的熱點話題情感分類,基於雙向循環神經網路的評價對象抽取研究,基於LSTM-CNN深度學習模型的評價對象情感傾向性研究,基於條件隨機域模型的比較要素抽取研究。情感分類技術和情感要素抽取技術已在國內情感分析研究中達到了較高水平,在2015年和2016年中國中文信息學會主辦的國內公開、權威的情感分析評測(COAE)中均取得了參與項目第一名,相關技術成果已套用在情感分析系統和對話系統中。 在熱點話題的情感趨勢分析和預測方面,課題組分別對長期熱點話題和短期熱點話題的不同特點進行建模研究。對於短期熱點話題開展的研究包括基於指數自回歸預測方法、基於GBDT的非線性回歸預測方法和基於CNN的預測方法;實驗結果表明基於GBDT的方法在預測誤差設定在5%以下時準確率可達到80%。對於長期熱點話題我們提出了基於子主題分離的預測方法,將長期話題的發展分為爆發期、過渡期、消退期和潛伏期四個階段,對於不同波峰之間的數據分別進行預測,實驗結果表明該方法對於話題熱度的分類準確率達到86%,整體趨勢預測也取得了較好的結果。 在微博用戶轉發行為及情感預測方面,課題組提出了基於主題模型的用戶轉發行為預測方法。該項研究在用戶歷史信息和用戶行為及情感之間建立關係,分析影響轉發行為的因素,並預測用戶的轉發行為。實驗結果表明,本項目提出的方法對轉發行為預測結果F1值可達到70%,在轉發情感預測方面情感預測正確率為64%。