《大規模稀疏學習及其套用研究》是依託南京航空航天大學,由劉俊擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:大規模稀疏學習及其套用研究
- 項目類別:青年科學基金項目
- 項目負責人:劉俊
- 依託單位:南京航空航天大學
項目摘要,結題摘要,
項目摘要
在包括微陣列基因表達、生物圖像分析、人臉識別及文本分類等套用中,數據維數通常達 1萬甚至1百萬以上,從而會導致嚴重的維數災難而使得泛化性能很差。稀疏學習是解決該問題的有效方法。其將特徵選擇嵌入具體的分類或回歸學習任務之中,以實現滿足給定準則的稀疏表示,因而已在機器學習、模式識別、信號處理及統計等領域受到廣泛關注。然而現有稀疏學習方法一般僅在維數較低時工作得較好,但在高維情況下,一般難以高效工作。本項目旨在已有工作基礎上,發展出相當高效的大規模稀疏學習方法。其具有如下優點:(1)靈活性和通用性,適用於任何基於2,1-範數正則化或約束的稀疏學習問題;(2)高效性,每步僅需計算函式值和梯度,代價小,且能獲得一階黑盒子方法收斂速度的上界;(3)可將不可導凸問題轉化成可導凸問題,進而採用歐幾里德投影實現對約束的高效處理;(4)實用性。本項目的最終成果無疑可為大規模的稀疏學習提供一條新途徑。
結題摘要
在包括微陣列基因表達、生物圖像分析、人臉識別及文本分類等套用中,數據維數通常達 1萬甚至1百萬以上,從而會導致嚴重的維數災難而使得泛化性能很差。稀疏學習是解決該問題有效方法。其將特徵選擇嵌入到具體的分類或回歸學習任務之中,以實現滿足給定準則的稀疏表示,因而已在機器學習、模式識別、信號處理及統計等領域受到廣泛關注。然而現有稀疏學習方法一般僅在維數較低時工作得較好,但在高維情況下,一般難以高效地工作。本項目旨在已有工作的基礎上,發展出高效的大規模稀疏學習方法,其具有如下優點:(1)靈活性和通用性,適用於任何基於2,1-範數正則化或約束的稀疏學習問題;(2)高效性,每步僅需要計算函式值和梯度,代價小,且能獲得一階黑盒子方法收斂速度的上界;(3)可將不可導凸問題轉化成可導凸問題,進而採用歐幾里德投影實現對約束的高效處理;(4)具有實用性。本項目側重快速算法研究以及提高分類性能,研究成果包括如下幾個方面:(1) 數據內在的結構特徵挖掘,(2) 圖像數據二維結構研究,(3)稀疏特徵挖掘,(4)自適應最優核學習。在主流期刊和會議上共發表12篇學術論文。