面向網路短文本輿情分析的層次化表達與計算機制研究

面向網路短文本輿情分析的層次化表達與計算機制研究

《面向網路短文本輿情分析的層次化表達與計算機制研究》是依託北京工業大學,由楊震擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向網路短文本輿情分析的層次化表達與計算機制研究
  • 項目類別:青年科學基金項目
  • 項目負責人:楊震
  • 依託單位:北京工業大學
項目摘要,結題摘要,

項目摘要

目前網路輿情分析相關研究大多針對普通網路信息進行,忽視了以手機簡訊、即時訊息等為代表的網路短文本信息的研究,而恰恰是這一部分內容更能反映真實網路輿情。因此開展面向短文本內容處理的研究具有重要戰略意義和社會效益。.由於文本對象所固有的多義性,面對短文本特徵稀疏和上下文缺失的情況,現有處理方法無法明辨語義,形成了底層特徵和高層語義間巨大的語義鴻溝。課題借鑑Marr層次化認知理論和Gestalt心理學依據,強調文本認知的層次性和整體性,注意高層描述與底層特徵表達的相互關聯,發展出刻畫文本對象多義性的層次化表達體系。基於此,研究用戶信息感知的垃圾過濾模型,實現有用信息和垃圾信息分離。並對有用信息進行基於知識本體語義空間流形聚類的話題發現。最後利用特殊上下文實現話題情感計算以判別信息傾向。研究將有助於緩解短文本底層特徵稀疏性和頂層語義表達多義性間的矛盾,從而跨越語義鴻溝,解決短文本內容信息處理問題。

結題摘要

目前網路輿情分析相關研究大多針對普通網路信息進行,忽視了以手機簡訊、即時訊息等為代表的網路短文本信息的研究,而恰恰是這一部分內容更能反映真實網路輿情。因此開展面向短文本內容處理的研究具有重要戰略意義和社會效益。由於文本對象所固有的多義性,面對短文本特徵稀疏和上下文缺失的情況,現有處理方法無法明辨語義,形成了底層特徵和高層語義間巨大的語義鴻溝。課題強調本認知的層次性和整體性,注意高層描述與底層特徵表達的相互關聯,發展出刻畫文本對象多義性的層次化表達體系。基於此,研究用戶信息感知的垃圾過濾模型,實現有用信息和垃圾信息分離。並對有用信息進行基於內容計算的話題發現。最後利用特殊上下文實現話題情感計算以判別信息傾向。課題研究成果將有助於緩解短文本底層特徵稀疏性和頂層語義表達多義性間的矛盾,從而跨越語義鴻溝,緩解短文本內容信息處理難題。經過三年的努力,課題組嚴格按照項目申請計畫,圓滿完成課題預期建設目標。課題組實現一套網路短文本信息過濾與分析原型系統,所開發的系統參加TREC信息檢索國際測試,取得較好成績。同時通過購買、參加國際測評和實驗室收集,初步建立了可為本類研究開展提供支持的短文本信息資料庫(包括簡訊息、電子郵件、微博、Tweets和個性化閱讀信息等)。積極搭建交流平台,邀請國內外學者舉辦講座研討會,開展國內外學術交流。發表(含已錄用)論文17篇,其中在國際期刊發表論文5篇,國內期刊發表論文6篇,SCI刊源3篇,EI刊源16篇。申請國家發明專利4項(3項授權,1項實審)。培養碩士研究生11名(畢業3名,在讀8名)。

相關詞條

熱門詞條

聯絡我們