基於實例遷移的文本情感分析領域適應問題研究

基於實例遷移的文本情感分析領域適應問題研究

《基於實例遷移的文本情感分析領域適應問題研究》是依託南京理工大學,由夏睿擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於實例遷移的文本情感分析領域適應問題研究
  • 項目類別:青年科學基金項目
  • 項目負責人:夏睿
  • 依託單位:南京理工大學
項目摘要,結題摘要,

項目摘要

情感分析領域適應問題是近幾年來自然語言處理領域的前沿問題和研究熱點。在領域適應問題的研究中,存在重標註遷移、輕實例遷移的現象:標註遷移已經得到了廣泛關注和深入研究;而實例遷移受制於機率比估計的難題,成為相對薄弱的環節和空白的地帶。本項目針對上述狀況,主要開展下列三方面的工作:1、針對實例遷移展開深入研究。將機率比估計問題轉化為樣本與分布的相似度計算問題,提出基於PU學習的源領域樣本與目標領域相似度計算方法;2、基於該相似度,研究跨領域統計建模中的樣本選擇和權重採樣方法,建立完善的基於實例遷移的領域適應模型;3、最後將問題擴展到多個源領域,探討基於多源領域協同的情感分析領域適應方法。本項目預計在國內外重要學術期刊和頂級國際會議上發表論文不少於6篇。本項目的完成將有助於推動大數據背景下面向網際網路海量和多源文本的情感分析方法的研究,具有重要的理論意義和套用價值。

結題摘要

情感分析領域適應問題是近幾年來自然語言處理領域的前沿問題和研究熱點。在領域適應問題的研究中,存在重標註遷移、輕實例遷移的現象:標註遷移已經得到了廣泛關注和深入研究;而實例遷移受制於機率比估計的難題,成為相對薄弱的環節和空白的地帶。本項目針對上述狀況,主要開展下列三方面的工作:1、針對實例遷移展開深入研究。將機率比估計問題轉化為樣本與分布的相似度計算問題,提出源領域樣本與目標領域相似度計算方法和基於樣本選擇和權重採樣的領域適應方法,建立完善的基於實例遷移的領域適應模型;2、將問題擴展到多個源領域,探討基於多源領域協同的情感分析領域適應方法;3、研究基於大數據環境的社交網路文本情感分析和領域適應問題。受到項目資助,一共發表論文12篇,其中以一作身份發表了5篇領域國際頂級期刊或會議論文(如IEEE TKDE, ACL, IJCAI, AAAI等),申請國家發明專利3項,軟體著作權登記1項。本項目的完成將有助於推動大數據背景下面向網際網路海量和多源文本的情感分析方法的研究,具有重要的理論意義和套用價值。

相關詞條

熱門詞條

聯絡我們