海量網路輿情信息獲取、分析及表達關鍵技術研究

海量網路輿情信息獲取、分析及表達關鍵技術研究

《海量網路輿情信息獲取、分析及表達關鍵技術研究》是依託上海交通大學,由李建華擔任項目負責人的面上項目。

基本介紹

  • 中文名:海量網路輿情信息獲取、分析及表達關鍵技術研究
  • 項目類別:面上項目
  • 項目負責人:李建華
  • 依託單位:上海交通大學
項目摘要,結題摘要,

項目摘要

課題重點研究多源媒體信息深度採集、網路信息的智慧型分析、輿情信息的綜合表達等核心理論及關鍵技術,並在此基礎上,開發一套對於網路輿情的全面掌握與客觀反映,為決策部門提供科學決策依據的網路輿情監測與預警原型系統。在信息深度採集方面,擬採用機器人動態仿真、內容協商等原理,研究動態WEB網頁、許可權保護論壇、即時通信網路等高難度信息源的信息自動採集技術,實現對高難度網路媒體信息的全面、深度採集。在信息智慧型分析方面,擬採用多媒體群件理解模型,研究海量網路信息的快速語義理解、特徵提取、快速分類和熱點識別技術,實現對網路信息的快速處理。在網路輿情信息的表達方面,擬重點分析相關部門對網路輿情分析需求的共同點,研究靈活、通用的網路輿情信息自動表達技術,實現對決策部門的技術支持。

結題摘要

隨著社交網路等網際網路服務的興起,社會個體在網路上發聲變得越來越普遍,輿情分析因此從社會學的定性研究轉變為基於信息分析的定量分析。近幾年中無論商業服務和政府管理都高度重視輿情分析,並以此為調整服務和管理的重要依據,全面掌握並客觀反映輿情的分析技術研究變得越來越迫切。 課題組從輿情理論研究和信息技術推進自動化輿情分析兩個角度入手,對輿情分析系統進行全面研究,為決策部門提供技術支持。本項目的研究成果主要有:信息深度智慧型採集的研究,針對微博數據進行了文本和多媒體的特徵分析和分類算法研究,以及社交網路分析、熱點分析、輿情指標體系等輿情管控關鍵技術研究。 在網路信息深度智慧型獲取領域,課題組進行遠程網路互動式動態信息提取的研究,形成了功能齊全、性能穩定的動態信息提取模型,通過對新型網路套用層通信協定的分析,進行信息高速捕獲的研究。課題組據此實現了高性能信息自動提取機器人原型。該原型能夠獨立地對指定網路動態媒體進行信息的深入提取,將為網路輿情管控中全面而深入的信息獲取提供支撐。 課題組提出並實現了基於稀疏編碼的圖像特徵抽取方法和基於DBN的分類識別技術,並在此基礎上提出了可套用於輿情分析的圖像內容分類框架。基於稀疏編碼的圖像特徵抽取方法解決了當前圖像分析中使用稀疏編碼效果不好的問題,設計實現了疊加子圖像的切分方法,通過Max-pooling池化法降低圖像特徵維度,結合DBN網路實施分類得到了很好的分類效果,通過實驗得到了分類系統的最佳分類參數。 文本信息處理方面,首先針對微博用詞隨意性大、語詞多創新的特點,提出了傳統分詞算法的最佳化算法,該算法能識別網路辭彙,並對新詞進行類型分類。其次,針對傾向性分析中的觀點要素和情感特徵抽取,進行了特徵分析研究並提出了基於紋理的文本特徵抽取方法。分類算法方面,課題組在已有工作基礎上探索了支持張量機在文本分類方面的套用,實現表明在小樣本和數據偏斜的情況下STM表現比SVM要好。 輿情管控方向上課題組提出了基於模糊聚類和標籤傳播的網路結構分析方法,提出了實時數據流中進行熱點分析方法,提出了微博重要度衡量指標,提出了能真實反映用戶影響力的計算方法。在輿情指標方面,課題組按主題制定了22個一級主題98個二級主題和133個三級主題基於分類的輿情評估指標計算體系。

相關詞條

熱門詞條

聯絡我們