《基於語義資源和深度學習的情感隱喻識別方法研究》是依託大連理工大學,由張冬瑜擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於語義資源和深度學習的情感隱喻識別方法研究
- 依託單位:大連理工大學
- 項目類別:青年科學基金項目
- 項目負責人:張冬瑜
項目摘要,結題摘要,
項目摘要
情感隱喻普遍存在於人類語言中,是對複雜、抽象的情感進行概念化的重要手段,也是情感分析深入發展面臨的重大挑戰之一。目前情感隱喻識別方法缺乏語義資源支撐和認知語言學指導,並且偏重隱喻識別而忽視了隱喻傳遞的情感信息。因此,本項目以認知語言學為指導,以語義資源建設為基礎,以深度學習等相關技術為主要支撐,展開情感隱喻識別研究,並以此為基礎提出跨語言情感隱喻的識別方法。首先構建面向情感隱喻識別的語義資源,主要包括採集語料、制定標註規範和質量監控體系;然後進行情感隱喻識別,利用命名實體識別等方法識別出本體、喻體以及所屬領域,通過領域衝突檢測判斷是否存在隱喻,再採用深度學習的卷積神經網路模型挖掘出隱喻傳達的情感;最後利用非監督自編碼神經網路模型,採用非監督的特徵學習訓練方式,進行跨語言隱喻識別。本項目將建立起較為完善的情感隱喻識別機制,從而提升情感分析精度,有助於情感分析和自然語言理解的深入發展。
結題摘要
近年來,隨著社交媒體的興起,隱喻表達出現在更加多元化的平台上,其數量遠遠超過人力處理的能力,因此如何藉助自然語言處理技術進行隱喻識別及套用研究得到了研究者廣泛的關注。隱喻識別旨在賦予計算機像人類一樣分析理解隱喻的能力,涉及計算機科學、認知語言學、心理學等多個學科的交叉,是一項極其重要並且富有挑戰的研究課題。本項目在情感隱喻語料庫構建基礎上,開展隱喻識別方法的研究,並以隱喻識別為基礎進一步探究其潛在的套用。(1)在情感隱喻語義資源建設方面,設計了基於認知語言學理論的標註框架以及有效、規範、合理的質量監控體系;構建了大規模的中文情感隱喻語料庫,為隱喻識別提供必要的語義資源。(2)在情感隱喻識別方面,提出了基於領域衝突、SVM以及LSTM的識別方法,實驗結果表明所提出的情感隱喻識別方法超過了現有基於人工特徵的分類模型及主流深度學習模型。(3)在隱喻套用研究方面,提出了基於隱喻的創造力與心理健康評估模型。結合上下文特徵和大學生心理測評報告結果,構建大學生心理健康問題預測模型,本文對基於隱喻特徵的寫作自動評價和心理健康狀態評測進行了有益地嘗試。項目執行期間,在情感隱喻語料庫、隱喻識別和套用方面取得了初步成果。在理論分析方面,在科學出版社出版專著《基於語義資源和認知視角的隱喻識別與套用》,總計17.4萬字。在研究論文方面,在自然語言處理的頂級會議ACL2018、EMNLP2018,、EMNLP2019、WWW2019上發表論文5篇,在SCI期刊和EI會議等發表論文10餘篇。在技術研發方面,研製了情感隱喻語料庫,獲得了軟體著作權一項。以此為數據集,承擔了第十七屆中國計算語言學學術會議(CCL2018)的中文隱喻計算評測工作,主持了“隱喻識別”和”隱喻情感分析”兩項任務。在人才培養方面,現已培養三名碩士生畢業。