讀者視角的跨領域隱式情感分析理論及關鍵技術研究

讀者視角的跨領域隱式情感分析理論及關鍵技術研究

《讀者視角的跨領域隱式情感分析理論及關鍵技術研究》是依託中山大學,由饒洋輝擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:讀者視角的跨領域隱式情感分析理論及關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:饒洋輝
  • 依託單位:中山大學
中文摘要,結題摘要,

中文摘要

網際網路蘊含了眾多用戶交流的觀點與情感,從中分析讀者用戶的隱式情感表達在挖掘公眾興趣與需求,了解社會發展動態,提高服務質量等方面都非常重要。但對於數據分布不一致的跨領域文本,詞形相似的語句或文檔可能引發讀者不同甚至對立的情感反饋,因此給精準地分析其隱式情感帶來了極大的挑戰。本項目將用句子、篇章及組合語義分析方法,重點研究如下內容:(1)設計句子層的規範化與自動標註方案,以補充跨領域隱式情感分析訓練數據集;(2)建立篇章層的語義分析模型,實現對跨領域隱式情感的有效抽取;(3)提出基於多層組合語義的分類算法,以提升跨領域隱式情感分類的精準度。研究成果不僅將解決隱式情感標註的領域及句子語義不足、跨領域的隱式情感抽取及分類不準等研究難題,還能為開發一個具有跨領域隱式情感標註、抽取及分類功能的實用系統奠定基礎。

結題摘要

本項目針對讀者視角的跨領域隱式情感分析,主要研究基於句子語義的跨領域隱式情感標註、基於篇章語義的跨領域隱式情感抽取,以及基於組合語義的跨領域隱式情感分類。(1)在基於句子語義的跨領域隱式情感標註方面,我們通過局部的one-hot詞向量、領域關聯的詞性組合向量,以及全局的詞嵌入向量構建一種混合卷積神經網路模型,從而解決詞形相似的句子可能引發不同的隱式情感反饋這一難題。該文發表在CCF A類會議WWW 2017的認知計算Track。此外,基於句子層的規範化標註方案,我們提出一種情感標籤最佳化的機率框架,以及一種基於機率圖模型的標籤聚合方法,以從海量網民提供的標籤中自動生成高質量的情感標註。相關成果發表在Knowledge-Based Systems期刊和CCF A類會議ACL 2017上。(2)針對跨領域隱式情感抽取中數據分布不一致的難題,本人提出一種背景主題、特定上下文主題,以及上下文無關主題的篇章語義分析模型。該文發表於IEEE Intelligent Systems期刊。此外,我們基於多元情感標籤、用戶投票數據,以及詞共現信息生成豐富的特徵,提出兩種有監督的情感主題模型。該文發表在CCF B類會議DASFAA 2017上,並獲得最佳論文亞軍獎。為了進一步提升跨領域隱式情感抽取等任務的精準度,我們提出一種基於孿生網路的有監督主題模型。該文發表在CCF B類會議EMNLP 2018上。(3)在基於組合語義的跨領域隱式情感分類方面,我們提出一種融合了辭彙和篇章兩層語義信息的跨領域隱式情感分類模型。該文發表於CCF B類會議CIKM 2017。此外,我們通過有向機率圖等模型獲取文本的篇章語義,並將其用於指導神經網路模型的參數學習。實驗驗證了上述組合模型在隱式情感抽取和分類中的有效性及魯棒性。該文發表於情感計算領域的頂級期刊IEEE Transactions on Affective Computing。在本項目資助下,項目組成員已發表26篇學術論文,包括11篇SCI檢索的期刊論文,1篇EI檢索的期刊論文,以及12篇EI檢索的會議論文。此外,獲得計算機軟體著作權2項。

相關詞條

熱門詞條

聯絡我們