《基於分組規劃的特徵選擇研究》是依託吉林大學,由王剛擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於分組規劃的特徵選擇研究
- 項目類別:青年科學基金項目
- 項目負責人:王剛
- 依託單位:吉林大學
項目摘要,結題摘要,
項目摘要
隨著科學技術的不斷發展,數據的採集和存貯能力迅猛發展,數據爆炸的時代已經來臨,高維數據降維成為眾多學者的研究熱點。特徵選擇是降維最有效最普遍的方法之一,尤其針對高維數據降維呈現出更為顯著的優勢。認清特徵選擇本質並為實際套用尋求快速、高精度、穩定的特徵選擇方法仍是一個未被解決的難題。與現有方法的研究思路完全不同,我們從最優特徵子集“內在”結構存在的亞穩定性出發,研究結構的組成、形成規律、約束條件,構建一種理論模型(分組規劃模型),解釋、刻畫、識別最優特徵子集,從而為特徵選擇提供方向引導和理論支持。在以上理論和方法的研究結果上,利用細菌覓食最佳化算法(BFO)和模糊邏輯控制構建快速、高精度的高維數據特徵選擇新方法,進一步利用特徵聚類和多任務學習適應缺失分類標籤數據、不平衡數據,從而增強特徵選擇算法的穩定性。本項目對促進特徵選擇理論及高維數據降維方法的研究具有十分重要的意義。
結題摘要
隨著科學技術的不斷發展,數據的採集和存貯能力迅猛發展,數據爆炸的時代已經來臨,高維數據降維成為眾多學者的研究熱點。特徵選擇是降維最有效最普遍的方法之一,尤其針對高維數據降維呈現出更為顯著的優勢。認清特徵選擇本質並為實際套用尋求快速、高精度、穩定的特徵選擇方法仍是一個未被解決的難題。與現有方法的研究思路完全不同,我們從最優特徵子集“內在”結構存在的亞穩定性出發,研究結構的組成、形成規律、約束條件,構建一種理論模型,解釋、刻畫、識別最優特徵子集,從而為特徵選擇提供方向引導和理論支持。主要研究內容包括:特徵選擇的理論模型研究、特徵選擇新方法、穩定特徵選擇方法、最佳化算法、機器學習共性關鍵技術、分類器最佳化方法。上述研究提高了特徵子集的質量,可有效提高分類器的穩定性、精度、數據適應性。本項目的成果已套用於多個在研項目,可一進步套用於數據挖掘、計算機視覺、無人系統等領域。