WEB2.0環境下基於本體學習的觀點挖掘研究

WEB2.0環境下基於本體學習的觀點挖掘研究

《WEB2.0環境下基於本體學習的觀點挖掘研究》是依託中南財經政法大學,由余傳明擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:WEB2.0環境下基於本體學習的觀點挖掘研究
  • 項目類別:青年科學基金項目
  • 項目負責人:余傳明
  • 依託單位:中南財經政法大學
項目摘要,結題摘要,

項目摘要

隨著Web 2.0的迅速發展,網際網路逐漸成為人們表達觀點、情感的重要渠道,網際網路上的主觀信息迅速增長。對這些觀點和評論進行分析能夠幫助企業改進產品與服務,及時修復可能潛在惡化的客戶關係,提高企業在市場中的競爭力,因而具有非常重要的套用價值與實踐意義。本體提供了共享特定領域信息內容的框架,作為智慧型知識處理的核心技術在計算機信息處理領域獲得廣泛的套用,並取得了較好的效果。本項目擬將本體技術與觀點挖掘結合起來,研究如何對WEB2.0環境下的多種網路數據源(例如BBS 、Blog、RSS等)的主觀評論信息進行收集,基於機器學習進行產品本體構建和情感辭彙本體構建,並利用構建的本體對產品屬性在辭彙和句子兩個層次進行自動化地極性分析,得到觀點極性集合,從而將非結構化的網上主觀評論以清晰的結構化方式顯示,繼而解決海量的評論信息與有限的人工閱讀能力之間的矛盾。

結題摘要

本體提供了共享特定領域信息內容的框架,作為智慧型知識處理的核心技術在計算機信息處理領域獲得廣泛套用,並取得了較好的效果。本項目將本體學習技術與觀點挖掘結合起來,對WEB2.0環境下的多種網路數據源(包括網路評論、維基百科、學術資料庫等)的信息進行收集,基於機器學習對產品本體構建和情感辭彙本體構建進行了理論探索與實證研究,並利用構建的本體對觀點挖掘進行了探索。在產品屬性識別方面,提出了一種將自然語言處理技術與支持向量機模型相結合,從客戶評論中識別產品屬性的方法。在產品名稱識別方面,以餐飲評論中的產品名稱識別為例,對利用條件隨機場模型從產品評論中識別產品名稱進行原理分析和實證研究,驗證了條件隨機場模型對於產品名稱識別的效果。本研究還提出了潛在狄利克雷分布模型與自然語言處理技術相結合的一種挖掘用戶評論熱點的方法,利用Gibbs抽樣計算模型參數, 獲取了評論熱點及相應的熱點詞語。實驗獲得的主題內容較好地反映了評論中的熱點, 與現實生活中用戶所關心的熱點基本吻合, 表明該模型具有較好的熱點識別效果。

相關詞條

熱門詞條

聯絡我們