基於短文本大數據的關聯分析和挖掘

《基於短文本大數據的關聯分析和挖掘》是依託南開大學,由楊征路擔任項目負責人的聯合基金項目。

基本介紹

  • 中文名:基於短文本大數據的關聯分析和挖掘
  • 項目類別:聯合基金項目
  • 項目負責人:楊征路
  • 依託單位:南開大學
中文摘要,結題摘要,

中文摘要

基於文本大數據的關聯分析和挖掘推薦作為幫助人們篩選有價值信息的技術手段,被廣泛套用在商業、社會安全、通信等領域。然而,針對短文本的挖掘問題,如微博輿情分析、基於用戶評論的商品推薦等,現有研究工作無法取得高質量結果。本項目擬藉助短文本語義關聯分析和挖掘推薦技術,整合計算資源高效高精度地解決此類問題。針對短文本的關聯分析和推薦技術研究有如下難點:(1) 短文本語義表示方法和相似度計算模型;(2)關聯分析和挖掘算法設計、並行處理及最佳化;(3) 基於短文本關聯分析和挖掘推薦技術實際套用的有效性。本項目擬針對上述難點逐項開展研究,分析短文本語義特點以設計計算模型,提出並實現有效關聯分析和推薦方法,並行化各算法建立統一系統平台。同時,對新方法進行理論分析及系統實驗測試,並與現有技術進行比較。相關研究成果有助於增強短文本關聯分析和挖掘技術套用範圍,能有效解決諸如社會輿情分析等問題,具有重要理論價值和實踐意義。

結題摘要

基於文本大數據的關聯分析和挖掘推薦作為幫助人們篩選有價值信息的技術手段,被廣泛套用在商業、社會安全、通信等領域。然而,針對短文本的挖掘問題,如微博輿情分析、基於用戶評論的商品推薦等,前人研究工作無法取得高質量結果。針對短文本的關聯分析和推薦技術研究主要存在如下難點:(1) 短文本語義表示方法和相似度計算模型;(2)關聯分析和挖掘算法設計、並行處理及最佳化;(3) 基於短文本關聯分析和挖掘推薦技術實際套用的有效性。本項目針對上述難點逐項開展了研究,並且完成了預期目標:共有26篇文章發表在計算機科學頂級期刊和會議,包括IEEE TKDE,WWW,AAAI 和IJCAI等,其中SCI論文6篇,EI論文20篇;一篇學術論文獲知名國際會議International Conference on Computational Linguistics (COLING 2018) 最佳論文提名;有一項個性化推薦系統相關技術專利及一項軟體著作權正在申請授權中。相關研究成果有助於增強短文本關聯分析和挖掘技術套用範圍,能有效解決諸如社會輿情分析等問題,具有重要理論價值和實踐意義。

相關詞條

熱門詞條

聯絡我們