《大規模垃圾郵件過濾中的集成化SVM增量學習機制研究》是依託浙江大學,由徐從富擔任項目負責人的面上項目。
基本介紹
- 中文名:大規模垃圾郵件過濾中的集成化SVM增量學習機制研究
- 依託單位:浙江大學
- 項目負責人:徐從富
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
以大規模垃圾郵件過濾為研究背景,探索並提出一種新的兼顧識別率和效率的集成化SVM增量學習機制。主要研究內容包括:(1)利用目標跟蹤原理與方法對SVM模型的支持向量和非支持向量的演變機制和規律進行跟蹤和預測,並借鑑Core Vector Machine思想,嘗試解決SVM增量算法中的效率問題;(2)探索AUC-maximization SVM的增量模型及算法,擬解決代價不對等問題,並進一步提高其效率;(3)引入Active Learning的思想,研究適套用戶反饋延遲的SVM增量學習模型及算法。研究目標是,得到能夠解決大規模垃圾郵件過濾的,具有高效、代價敏感和延遲適應等特點的增量學習機制、模型及算法。本研究可望對統計學習方法的基礎理論、模型和算法有所促進,且為大規模垃圾郵件過濾、手機垃圾簡訊過濾、網路不良信息過濾等套用提供理論和技術支持。
結題摘要
本項目以大規模垃圾郵件過濾為研究背景,探索並提出了兼顧識別率和效率的集成化SVM增量學習機制。主要研究內容包括:(1)組合多分類器的研究(2)稀疏無監督降維算法的研究(3)集成分類器在大規模垃圾郵件過濾中的套用(4)Online SVMs在大規模垃圾郵件過濾中的套用(5)基於編碼的預處理方法在垃圾圖片過濾及中文文本分類中的套用(6)在分類器的決策區域內訓練分類器的研究(7)用知識層次研究分類器的研究(8)馬爾科夫邏輯網的理論研究(9)基於文本和圖片特徵的融合模型在垃圾圖片過濾中的套用。本項目對統計學習方法的基礎理論、模型和算法有所促進,而且為大規模垃圾郵件過濾、手機垃圾簡訊過濾、網路不良信息過濾等套用提供理論和技術支持。