《大數據環境下基於領域知識獲取與對齊的觀點檢索研究》是依託中南財經政法大學,由余傳明擔任項目負責人的面上項目。
基本介紹
- 中文名:大數據環境下基於領域知識獲取與對齊的觀點檢索研究
- 項目類別:面上項目
- 項目負責人:余傳明
- 依託單位:中南財經政法大學
項目摘要,結題摘要,
項目摘要
對網路評論進行及時分析能夠幫助企業改進產品與服務,及時修復可能潛在惡化的客戶關係,具有重要的套用價值。隨著大數據時代的到來,與同一產品或者同一話題相關的網路評論在不同領域、不同語言等方面所呈現的前所未有的分散性和多樣性給觀點檢索帶來了巨大挑戰。本課題嘗試用領域知識獲取與對齊理論來解決觀點檢索由小數據向大數據轉移過程中所難以迴避的領域跨度和語言跨度問題。基於領域知識獲取與對齊的理論研究,構建大數據環境下的觀點檢索集成框架,並在該框架內開展一系列具有領域跨度、語言跨度的觀點檢索實證研究。項目對大數據環境下的多領域多語言的領域知識獲取、對齊、語義標註、索引、匹配、查詢擴展以及可視化等問題的研究,能夠為商業機構提升網路競爭情報蒐集與分析的效率,為用戶掌握網路評論的動向提供有效參考。項目將解決大數據環境下的觀點檢索的可用性問題,豐富這一領域的研究內涵,促進情報學方法在觀點檢索中的套用。
結題摘要
對網路評論進行及時分析能夠幫助企業改進產品與服務,及時修復可能潛在惡化的客戶關係,具有重要的套用價值。隨著大數據時代的到來,與同一產品或者同一話題相關的網路評論在不同領域、不同語言等方面所呈現的前所未有的分散性和多樣性給觀點檢索帶來了巨大挑戰。項目組成員通過四年時間的努力,按照預定研究工作方案,實現團隊成員間實質性合作,利用人工智慧、機器學習、連結預測、知識圖譜、自然語言處理等相關技術,圍繞觀點檢索這一新興課題在大數據環境下所面臨的領域跨度問題、語言跨度問題、規模跨度問題、領域知識對齊、查詢擴展、查詢匹配、主題檢索、虛假評論識別、觀點極性分析、情感原因分析以及觀點可視化等展開研究。針對上述研究問題,提出了跨領域深度循環神經網路模型、跨語言深度表示學習模型以及個人–群體–商戶的主體關係模型等,構建了面向大數據的觀點檢索框架體系,在Journal of Informetrics, Scientometrics, Journal of Information Science, Information Retrieval, iConference等國際圖情領域重要學術期刊與會議上發表論文7篇,在行業權威期刊、核心期刊發文20餘篇,構建跨領域情感分析數據集1個,跨語言情感分析數據集1個,開發ZUEL-OR檢索原型系統1個。項目成果在理論上具有較強的前瞻性,有助於解決大數據環境下的觀點檢索可用性問題,豐富這一領域的研究內涵,促進情報學方法在觀點檢索中的套用;在實踐上具有較強的參考價值,能夠為商業機構提升網路競爭情報蒐集與分析的效率,為用戶掌握網路評論的動向提供有效借鑑。