《面向產品評論的評價對象層次結構分析與極性識別》是依託哈爾濱工業大學,由趙妍妍擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:面向產品評論的評價對象層次結構分析與極性識別
- 依託單位:哈爾濱工業大學
- 項目類別:青年科學基金項目
- 項目負責人:趙妍妍
項目摘要,結題摘要,
項目摘要
評價對象的抽取與極性識別研究是面向產品評論的情感傾向性分析領域的重要研究任務。然而對於評價對象的抽取任務,現有研究忽視了評價對象的層次性和完整性,為精準的情感傾向性分析套用帶來了很大的困擾;對於評價對象的極性識別任務,現有研究僅關注含有評價詞語等明顯極性特徵的顯式評價,忽略了極性特徵不明顯的隱式評價,造成部分評價對象的極性丟失。基於此,本項目提出評價對象層次結構分析的研究任務,表現為產品品牌、屬性和子屬性三個層次組成的層次結構,挖掘評價對象內部完整的層次關係。同時,將評價對象對應的評價文本分為顯式評價和隱式評價,分別進行極性算法研究。具體內容有:評價對象層次結構的無指導識別算法;面向顯式評價的基於句子壓縮的評價搭配抽取算法;面向隱式評價的基於圖的篇章內外特徵相融合的極性識別算法。本項目旨在深入研究相關算法,更精確、有深度且全面的挖掘評論中的情感信息,為情感文摘、電子商務等套用提供技術支持。
結題摘要
評價對象的抽取與極性識別研究是面向產品評論的情感傾向性分析領域的重要研究任務。然而對於評價對象的抽取任務,現有研究忽視了評價對象的層次性和完整性,為精準的情感傾向性分析套用帶來了很大的困擾;對於評價對象的極性識別任務,現有研究僅關注含有評價詞語等明顯極性特徵的顯式評價,忽略了極性特徵不明顯的隱式評價,造成部分評價對象的極性丟失。基於此,本項目提出評價對象層次結構分析的研究任務,表現為產品品牌、屬性和子屬性三個層次組成的層次結構,挖掘評價對象內部完整的層次關係。同時,將評價對象對應的評價文本分為顯式評價和隱式評價,分別進行極性算法研究。為了解決上述的研究任務,本項目提出了一整套面向評價對象的情感傾向性分析框架,重點對多項關鍵技術進行攻關,並提出了新穎實用的算法。具體如:分別對評價對象層次結構分析的兩個步驟基於深度學習的思想提出新穎的算法來解決評價對象不完整的問題;基於句子壓縮的評價搭配抽取將解決由於句法分析結果不準確而帶來的干擾問題;基於圖的篇章內外特徵相融合的算法避免了含有隱式評價的評價句內部極性特徵不充分的情況,更全面的對評價對象進行極性識別。同時,受本項目的資助,我們取得了一系列的研究成果:構建細粒度情感分析語料一套,並為國際評測SemEval2016年的情感分析評測提供了中文語料;發表學術論文21篇,其中SCI 6篇,EI 10篇,頂級/重要國際會議7篇(CCF A/B類);申請專利1項。在情感傾向性分析領域參與培養博士生 2 名,碩士研究生 5 名。該項目的研究可以將無結構化的評論文本轉化為結構化的情感信息資料庫,這些成果會進一步推動情感傾向性分析的基礎研究工作,並為文本情感傾向性分析的套用如情感文摘及電子商務等提供關鍵技術支撐。