《基於機率圖的話題傳播與演化分析方法研究》是依託中國人民解放軍國防科技大學,由胡艷麗擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於機率圖的話題傳播與演化分析方法研究
- 項目類別:青年科學基金項目
- 項目負責人:胡艷麗
- 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,
中文摘要
在網路輿論分析中,追蹤話題的動態演化和傳播過程具有重要的理論意義和套用價值。由於話題具有隱含性、語義模糊性和不確定性,且輿情信息規模巨大、網路成員間的社會影響複雜多變,如何分析話題傳播和演化一直是網路輿論演化分析面臨的主要挑戰之一。本課題研究基於機率圖的話題傳播和演化分析方法,旨在建立話題傳播和演化分析的統一框架,獲取準確、有效的話題演化關係和傳播路徑。擬開展以下研究:(1)在話題演化方面,針對話題的語義模糊性和不確定性,採用機率生成模型提出線上子話題發現和關聯分析方法;(2)在話題演化分析基礎上,提出基於貝葉斯網路的話題傳播分析方法;因為先驗知識對模型求解的準確性具有重要影響,進而提出基於社會網路分析的話題傳播先驗知識建模方法;(3)在套用方面,針對理論驗證困難和實證研究匱乏問題,實時有效採集大規模輿情信息和線上社會網路數據,採用真實的話題傳播和演化實例驗證上述理論方法的準確性與實用性。
結題摘要
在網路輿論分析中,追蹤話題的動態演化和傳播過程具有重要的理論意義和套用價值。針對網路輿情信息的海量實時特點和網路輿論處置的應急回響需求,本項目重點開展線上社會網路中話題傳播與演化分析模型與方法,以及基於話題的用戶影響力評估、信息擴散能力預測分析和觀點演化等方面的套用研究。 提出了基於機率生成模型的線上話題傳播與演化分析方法,開展子話題發現和關聯分析研究:提出了基於LDA模型的子話題發現方法,線上抽取網路信息中隱含的話題片斷,定義了子話題產生、消亡、繼承、分裂和合併五種演化類型,提出了基於相對熵的子話題時序-內容二維關聯分析方法,根據子話題語義相似度和時序關係建立子話題間的關聯,通過子話題內容和強度的變化描述話題演化。 提出了基於貝葉斯網路的話題傳播分析方法,分析了網路新聞傳播過程,採用貝葉斯網路結構學習算法進行話題傳播路徑分析,並與新聞傳播學界的研究結果與網際網路新聞媒體網路排名進行對比,驗證了話題傳播分析方法的有效性。 開展了線上社會網路結構和演化分析實證研究,針對線上論壇網路及微博網路採集並構建真實的線上社會網路,分析了線上社會網路的拓撲結構、社會結構及其動態演化特性,以及網路成員行為的統計特性,分析用戶間的社會聯繫和影響力,為線上社會網路中的信息傳播提供實證依據。 在此基礎上,開展話題傳播與演化分析方法的套用研究。提出了基於用戶屬性與多關係網路的用戶影響力分析模型,開展基於話題的用戶影響力分析,考慮用戶相關屬性以及用戶之間的關注、轉發、回復關係,以及發布博文內容相似度和時間相似度關係進行建模,計算用戶之間的影響力。 提出了基於數據挖掘的信息擴散能力預測分析方法,定義了信息擴散能力,採用數據挖掘的方法,採集Twitter數據集,進行數據預處理、特徵提取,從用戶和博文這兩個方面提取出反映用戶信息擴散能力的相關特徵,以xgboost算法作為基礎模型,套用於多個特徵群、多組參數、數據集分時條件下,借鑑Stacking的思想,提出多視角多參分時堆融合算法,以融合後的模型綜合預測用戶的信息擴散能力。 提出了基於社會影響的觀點演化模型,借鑑統計物理學中的粒子互動作用描述輿論演化過程中網路成員間的相互作用,採用平均場理論進行解析,分析網路成員堅持度以及社會影響對觀點演化的影響,分析了網路輿論演化的臨界點和湧現機制,揭示輿論演化的內在規律。