面向Web主觀性文本意見挖掘研究

《面向Web主觀性文本意見挖掘研究》是依託北京理工大學,由牛振東擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向Web主觀性文本意見挖掘研究
  • 依託單位:北京理工大學
  • 項目負責人:牛振東
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

面向Web主觀性文本意見挖掘通過自動的方法對部落格、微博、線上評論等Web主觀性文本信息進行挖掘和分析。它是智慧型信息處理、數據挖掘、計算語言學等領域的前沿性課題,通常面臨著情感特徵空間巨大,有效特徵稀疏、情感詞典構建困難等問題。本項目主要研究Web主觀性文本細粒度意見挖掘、自適應評價特徵聚類和領域情感詞典自動構建等關鍵技術。針對細粒度意見挖掘中存在有效特徵稀疏和缺乏統一框架的問題,研究基於序列標註學習的融合多級特徵的細粒度挖掘模型。針對評價特徵聚類中存在的語義關聯信息不足的問題,提出基於約束譜聚類的自適應評價特徵聚類算法。針對情感詞典自動構建中存在的領域依賴性和情感關聯信息不足問題,研究如何自動獲取領域先驗知識和增強候選情感詞之間的情感關聯信息,提出基於約束標籤傳遞的領域情感自動構建算法,該方法可解決傳統領域情感詞典構建中需要人工標註領域數據的問題,具有良好的領域適應性。

結題摘要

面向Web主觀性文本意見挖掘通過自動的方法對部落格、微博、線上評論等Web主觀性文本信息進行挖掘和分析。它是智慧型信息處理、數據挖掘、計算語言學等領域的前沿性課題,通常面臨著情感特徵空間巨大,有效特徵稀疏、情感詞典構建困難等問題。本項目主要研究Web主觀性文本細粒度意見挖掘、自適應評價特徵聚類和領域情感詞典自動構建等關鍵技術。項目針對細粒度意見挖掘中存在有效特徵稀疏和缺乏統一框架的問題,研究基於序列標註學習的融合多級特徵的細粒度挖掘模型;針對評價特徵聚類中存在的語義關聯信息不足的問題,提出基於約束譜聚類的自適應評價特徵聚類算法;針對情感詞典自動構建中存在的領域依賴性和情感關聯信息不足問題,研究如何自動獲取領域先驗知識和增強候選情感詞之間的情感關聯信息,提出基於約束標籤傳遞的領域情感自動構建算法,該方法可解決傳統領域情感詞典構建中需要人工標註領域數據的問題,具有良好的領域適應性。此外,針對傳統兩階段方法中主題得分和意見得分的融合問題,完善所提出的將生成模型和混合模型進行結合的部落格意見檢索方法;結合學術文獻檢索,提出一種基於本體的文獻語義索引,並開展文獻情感分析工作;針對由於事件發現算法沒有考慮用戶偏好,個性化推薦算法沒有考慮新聞的事件相關性問題,提出一種基於分散式的新聞事件混合推薦算法;針對數據實體抽取、不平衡性數據分類、Top N推薦、新聞事件意見檢索等課題相關問題開展研究。圍繞課題目標和任務,課題組已在Journal of Intelligent Information Systems 、Knowledge-based System、Frontiers in Computational Neuroscience 、Future Generation Comp. Syst.、Eng. Appl. of AI、Neurocomputing、Artificial Intelligent Review 等主流SCI期刊錄用發表論文10多篇、在WISE、WAIM 、KSEM 等主流國際會議錄用發表學術論文10多篇;申請專利4項,培養博士後1名,博士生5名、碩士生10多名,完成了項目預期目標。

相關詞條

熱門詞條

聯絡我們