半監督文本情感分類方法研究

半監督文本情感分類方法研究

《半監督文本情感分類方法研究》是依託蘇州大學,由李壽山擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:半監督文本情感分類方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:李壽山
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

文本情感分類是自然語言理解的一個研究熱點,具有著廣泛的研究價值和套用前景。本項目將在前期研究的基礎上,重點研究困擾目前文本情感分類研究的兩個關鍵問題:一是如何減少對大規模人工標註語料的依賴;二是如何解決文本情感分類中特徵空間的高維度問題。主要研究內容包括:(1)在語言學理論的指導下,研究文本的多視圖表示,進而實現基於多視圖的半監督文本情感分類方法,在少量人工標註語料的基礎上,利用大規模非標註語料提高系統性能;(2)探索基於多視圖的主動學習文本情感分類方法,在不影響性能的情況下,顯著降低人工標註語料的規模。同時,將該主動學習方法與基於多視圖半監督學習方法結合,在儘可能使用少的標註語料的情況下,利用大規模非標語料進一步提高系統性能;(3)研究文本情感分類的特徵提取方法,重點研究在半監督學習機制下的特徵提取方法,在不影響系統性能的情況下,大幅度降低文本特徵空間的維度。

結題摘要

本課題旨研究文本情感分類中的半監督學習方法,重點研究基於多視圖的半監督情感分類方法,並提出主動學習方法進一步減少情感分類對標註樣本的依賴,為情感分類的進一步研究打下了紮實的基礎。 三年來,課題總體進展順利,所有研究計畫已按照要求完成,達到預期目標。特別是:(1)在多視圖的半監督情感分類方法方面,提出了基於動態特徵子空間的視圖劃分方式,成功套用於不平衡情感文本分類問題中;(2)在主動學習的情感分類方法方面,同時利用兩個子空間進行確定性和不確定性計算,有效減低了情感分類對標註樣本的依賴;(3)將主動學習方法套用到跨領域情感分類問題中,提出了基於QBC策略的主動學習方法,有效提高情感分類的領域適應性能。 三年來,發表SCI索引源期刊論文1篇,國際重要會議AAAI/IJCAI/CIKM/ACL/EMNLP/COLING論文9篇;獲得專利授權2件。

相關詞條

熱門詞條

聯絡我們