《社交媒體多模態品牌追蹤與事件檢測》是依託大連理工大學,由李豪傑擔任項目負責人的面上項目。
基本介紹
- 中文名:社交媒體多模態品牌追蹤與事件檢測
- 依託單位:大連理工大學
- 項目類別:面上項目
- 項目負責人:李豪傑
項目摘要,結題摘要,
項目摘要
社交媒體特別是微博作為用戶信息共享平台近年來得到了空前發展,成為網路輿情的重要載體。如何高效地從海量微博數據中獲取用戶對產品的觀點和態度成為企業的迫切需求和面臨的挑戰性問題。現有研究大都集中於使用單模態即文本對品牌進行跟蹤分析,而忽視了微博中內含的圖像模態信息,因而獲取信息的覆蓋性和準確性有待提高。本課題致力於研究基於多模態的品牌追蹤和事件檢測技術,從圖像檢索、聚類及多模態融合角度對其中的關鍵問題和技術展開研究。具體內容包括:結合文本和圖像檢索的多源多模態微博信息採集及重排序技術;用於微博濾噪的高效準確的商標檢測方法;基於文本和圖像聯合譜聚類進行品牌感興趣事件檢測,並對事件進行多模態呈現;深入分析並構建微博熱點事件特徵模型,進而研究有效的熱點事件預警方法。本課題將有力推動微博等社交媒體輿情監控的理論發展和套用,為企業決策和網路傳播環境監管提供核心算法和技術。
結題摘要
社交媒體特別是微博作為用戶信息共享平台近年來得到了空前發展,成為網路輿情的重要載體。如何高效地對海量多模態微博數據進行分析、挖掘以獲取用戶對品牌的態度成為企業的迫切需求和面臨的挑戰性問題。本課題針對社交媒體品牌數據挖掘的關鍵問題進行了較深入的研究,取得了一系列創新性研究成果。包括:綜合利用演變關鍵字、關鍵用戶、相似圖像檢索以及位置信息的微博數據採集方法,半監督的結合文本和圖像信息的多模態的微博重排序方法,用於微博數據濾噪的具有高區分性和社交感知的多視角嵌入方法,基於深度學習的商品商標多尺度檢測方法,一種緊湊的面向圖像檢索的對象級深度特徵聚合方法,基於深度神經網路的融合博文文本和圖片信息的微博語義位置預測方法,尺度自適應的端到端的文本檢測方法,基於顯著性檢測的非監督商品對象檢索方法,以及基於產品評論層次化屬性結構的品牌排序等。此外,課題組聯合新加坡國立大學Chua Tat-Seng課題組,共同構建了一個大規模的品牌數據集,供研究者對微博檢索、事件檢測等算法進行驗證和性能評價;該數據集共包含了100個流行品牌的3,000,000個微博數據(其中約1,300,000個微博包含了圖片數據),覆蓋了汽車、運動服飾、電子產品、化妝品和食品等各個行業。同時,課題組開發了一個基於圖的大規模微博數據可視化原型系統,可通過數據聚類、相似微博檢索等功能實現對微博數據的多粒度觀測和事件分析,幫助用戶對數據有更加深刻的認識。以上成果發表論文29篇,其中期刊論文11篇,會議論文18篇。項目成果有力推動了社交媒體多模態數據挖掘的理論和技術研究,並為海量微博數據檢索提供了一些可行的技術方案,對相關套用系統具有借鑑意義。