基於聚合的社會化短文本信息處理與細粒度傾向性分析

基於聚合的社會化短文本信息處理與細粒度傾向性分析

《基於聚合的社會化短文本信息處理與細粒度傾向性分析》是依託南京理工大學,由薛春香擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於聚合的社會化短文本信息處理與細粒度傾向性分析
  • 項目類別:青年科學基金項目
  • 項目負責人:薛春香
  • 依託單位:南京理工大學
項目摘要,結題摘要,

項目摘要

面向基於社會化媒體信息的細粒度傾向性分析的實際需求,針對社會化短文本信息由於文字簡短導致的語境缺失、特徵稀疏問題,本研究提出基於多層次、多維度信息聚合解決方案。本項目綜合運用實證分析、模型構建和原型系統驗證等研究方法,梳理和描述社會化短文本信息屬性特徵,剖析從數據整合-內容聚合-結果呈現不同階段社會化短文本信息處理和分析的聚合要求,探索基於內容聚合和社會化屬性特徵聚合的社會化短文本信息語境生成,構建基於主題相關性的傾向性分析和融合人群特徵的群體傾向性分析模型。本項目採用多層次、多維度的聚合實現短文本信息的語境生成和情感語義分析,融合內容分析和社會化屬性特徵進行細粒度傾向性分析,為社會化短文本信息處理與細粒度傾向性分析提供新的思路和方法。

結題摘要

Web2.0技術與社會化媒體的飛速發展,改變了人們的生活和學習方式,網際網路用戶不僅僅是信息的接受者,亦是信息的生產者和傳播者。他們通過網路社區、微博、QQ群、微信群、評論站點等各種社會化媒體表達自己對人物、事件、政策、商品、服務等的關注和觀點,產生了海量的半結構化或非結構化、負載有觀點和情感的社會化短文本信息。為了更好地從這些短文本信息中抽取知識、發現主題、挖掘用戶情感傾向,本研究從信息聚合角度出發,剖析社會化短文本信息的內容特徵、外部特徵和傳播特徵,以微博、線上新聞評論和網路群組聊天記錄這三種典型的社會化短文本信息為研究對象,分別探索基於聚合的微博短文本主題發現和情感傾向性分類,融合社會化屬性特徵的線上新聞評論生長規律和分布規律發現,基於用戶互動關係的網際網路群組信息主題發現。 本項目主要工作包括:(1)以微博博文為研究對象,較系統地探索這類社會化短文本信息的特點和信息處理方法,具體包括:微博用戶標籤與博文主題相關性研究;基於信息聚合的微博短文本主題發現研究;多特徵融合的微博情感傾向性分析。(2)以線上新聞評論這類社會化短文本信息為研究對象,通過抽取評論文本中的用戶信息、地理信息、時間信息、轉發點讚等社會化信息,結合這些屬性來研究線上新聞評論的生長規律和分布特徵。結果表明,用戶個體屬性特徵對於社會化短文本信息生成和傳播擴散具有影響力。(3)以網際網路群組信息為研究對象,通過對用戶互動關係的識別來聚合學術型QQ群組中的聊天記錄,從而解決QQ群組中聊天短文本的主題發現問題。結果表明,基於用戶互動關係的信息聚合能夠較好地挖掘網路非正式信息交流中的知識。

相關詞條

熱門詞條

聯絡我們