《融合網路特徵的文本觀點挖掘》是依託中國人民解放軍國防科技大學,由王挺擔任項目負責人的面上項目。
基本介紹
- 中文名:融合網路特徵的文本觀點挖掘
- 項目類別:面上項目
- 項目負責人:王挺
- 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,
中文摘要
網際網路信息的內容分析具有重要的理論意義和套用價值,觀點挖掘是將網路信息內容分析引向深入的重要途徑。本項目根據當前網路信息發展的趨勢,把觀點挖掘問題放在社會化媒體背景下進行研究。針對Web發展中觀點挖掘出現的新特點,即觀點表達上的特點、文本質量上的特點、文本觀點與社會網路相互作用的特點等,通過有機結合觀點挖掘和社會化媒體分析,從觀點相關特徵分析、觀點文本質量分析、結合社會網路特點的觀點分析等三個方面開展研究,擬提出網路文本的觀點表達的語言特徵和環境特徵發現方法、融合話題相關性和社會化特徵的觀點文本的質量度量方法、以及結合社會網路特點的觀點分析方法,力求在觀點的語言表達分析、高質量信息獲取、以及觀點挖掘和社會網路相互作用等關鍵科學問題的研究中獲得進展和突破。本項目將形成面向社會化媒體、結合網路特徵進行觀點挖掘的理論、方法和關鍵技術,為深化網際網路信息的內容分析提供支持。
結題摘要
網際網路信息分析的研究具有重要的理論意義和套用價值,觀點挖掘是當前自然語言處理和Web挖掘領域的研究熱點之一。本項目根據當前網路信息發展的趨勢,針對網路社交媒體的觀點挖掘中的關鍵問題開展研究。針對Web2.0、特別是在社交媒體的觀點文本中,存在著質量參差不齊、結構和社會特徵豐富等特點,本項目圍繞社交媒體中觀點的語言表達分析、支持觀點挖掘的高質量信息獲取、以及觀點和社會網路相互作用等關鍵科學問題,開展文本觀點挖掘研究。 在網路觀點文本的獲取方面,提出了信息過濾與文本質量評估、社交媒體觀點檢索等方法,為後續的觀點分析挖掘工作提供具有較高質量的觀點文本;在網路文本的特徵分析方面,提出了基於“積木”的社交媒體的文本結構特徵分析、基於結構化機器學習的詞義消歧、以及話題和觀點相融合的文本的主觀性建模等方法,挖掘了網路文信息在文本結構、詞義表達和主觀性三方面的特徵,為觀點分析提供支持;在結合社會化媒體特徵的觀點分析方面,提出了基於語義關係的情感詞典自動構建、網路評論信息的搭配識別、無監督自舉式情感傾向性判斷等方法,增強了情感傾向性分析方法的領域適應性,提高了觀點分析的效果。 本項目面向網路社交媒體,結合網路特徵進行觀點挖掘研究,提出了網路觀點文本獲取、文本的特徵分析和結合社交媒體特徵的觀點分析方法,為進一步深化網際網路信息的內容分析提供支持。 結合項目研究成果,項目組發表論文14篇,其中在World Wide Web等國際SCI期刊上發表5篇,在AAAI、SIGIR和ICWSM等重要國際會議上發表7篇,在國核心心學術期刊上發表2篇,EI 收錄9篇。上述論文已經被國內外同行多次引用。