《從大數據到小信息——支持粒度機建模及套用研究》是依託山西大學,由郭虎升擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:從大數據到小信息——支持粒度機建模及套用研究
- 項目類別:青年科學基金項目
- 項目負責人:郭虎升
- 依託單位:山西大學
項目摘要,結題摘要,
項目摘要
目前,大數據問題已經成為人工智慧、機器學習等領域的研究熱點。針對支持向量機(SVM)處理大數據挖掘性能較低的問題,本項目擬深入開展面向大數據的高效支持粒度機最佳化建摸及套用研究。具體研究內容包括:(1)結合粒度計算、主動學習、線上學習、增量學習等人工智慧方法,分別構建面向大容量、多類型、高價值、快速度大數據問題的“小信息”抽象、表示、存儲、分析方法;(2)面向不同類型的大數據問題,通過大數據到“小信息”的轉化,深入探討信息挖掘的新機制;(3)通過樣本的動態層次粒劃分,構建多層粒度信息空間,設計面向大數據問題的支持粒度機信息挖掘模型;(4)系統構建面向大數據的建模、分析、挖掘與評測平台,並用於圖像識別、郵件分類、蛋白質互作用關係預測等領域。本項目研究成果將豐富和完善大數據處理的相關理論、建模及套用研究,對大數據挖掘的研究有重要的理論意義和套用價值。
結題摘要
支持向量機作為一種有效的機器學習方法,在許多領域得到成功的套用,但隨著所處理問題的數據規模增大、數據結構日趨複雜,其學習效率和泛化能力受到極大制約,進而限制了它的進一步套用。本項目系統研究了提高SVM處理複雜數據效能的方法,已完成的主要內容包括:(1)結合多概念層次的粒度劃分理論,構建了基於多層粒度劃分的支持向量機高效學習方法;(2)探討了粒度支持向量機的核心本質及相關問題;(3)採用半監督組合最佳化的方式,構建了面向稀疏標籤數據的增量學習方法;(4)結合多視窗的學習技術,設計了流數據的高效挖掘模型及有效的概念漂移檢測機制;(5)構建了面向區間型的複雜特性數據的學習方法;(6)構建了面向複雜數據處理的支持向量機學習平台。本項目研究成果豐富和完善了支持向量機的理論和算法研究、拓展了支持向量機的套用領域,對大規模複雜數據處理的研究有重要的理論意義和套用價值。