《基於數據重構的社會突發事件文摘研究》是依託天津大學,由賀瑞芳擔任項目負責人的面上項目。
基本介紹
- 中文名:基於數據重構的社會突發事件文摘研究
- 項目類別:面上項目
- 項目負責人:賀瑞芳
- 依託單位:天津大學
項目摘要,結題摘要,
項目摘要
社會媒體作為主導的通訊手段,非常規突發事件頻發使得研究社會媒體下的高效信息獲取刻不容緩。本課題正是以危機事件應急回響與應急決策為套用前景,以社會媒體產生的特定危機事件話題相關的微博集作為研究對象。探索基於數據重構的社會突發事件文摘加速算法新思路,以滿足文摘內容選擇的重要性、可信度、新穎性以及覆蓋性。抓住社會媒體的新挑戰:1.簡短、口語化、無結構性;2.社交、信任性;3.時序冗餘性。由於傳統文摘方法無法適應這些新挑戰,為此探索從壓縮感知、數據重構角度,藉助稀疏學習及社會學相關研究成果,將新挑戰建模到稀疏最佳化模型中,提出:1.基於小波分析時間窗自適應的重要時間點選擇;2.基於組結構化稀疏學習聯合的內容選擇;3.融合可信度建模的最佳化內容選擇;4.時序演化性導向的Sparse Fused Group Lasso內容選擇。由此發展社會突發事件文摘內容選擇的加速機器學習框架,有著重要的研究和套用價值。
結題摘要
社會突發事件文摘研究面向特定話題相關的微博集進行自動摘要。抓住社會媒體的新挑戰:1.簡短、口語化、無結構性;2.社交、信任性;3.時序冗餘性。由於傳統文摘方法無法適應這些新挑戰,為此探索從壓縮感知、數據重構角度,藉助稀疏學習及社會學相關研究成果,經過四年的探索,本課題圍繞如何將新挑戰建模到稀疏最佳化摘要模型中,以滿足文摘內容選擇的重要性、可信度、新穎性以及覆蓋性,主要進展包括:1.建設了一定規模的社會媒體摘要評測語料;2.提出融合時序社交語境分析的時序推特摘要方法;3.基於組結構化稀疏學習聯合的內容選擇;4.融合可信度建模的最佳化內容選擇;5.融合社會媒體用戶動態行為的短文本話題檢測方法。本項目通過對社會媒體靜、動態特性的挖掘和建模分析,探索內容和社會網路結構的結合是否對社會媒體摘要有正向的影響以及社會學理論如何影響摘要模型的建立。本研究在輿情監控與信息安全,金融、軍事情報分析及應急回響與決策支持等方面有著潛在的套用前景,為此發展社會突發事件文摘內容選擇的加速機器學習框架,有著重要的學術和套用價值。