《基於Lp正則化支持向量機的基因選擇算法研究》是依託湖南大學,由姚蘭擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於Lp正則化支持向量機的基因選擇算法研究
- 項目類別:青年科學基金項目
- 項目負責人:姚蘭
- 依託單位:湖南大學
中文摘要,結題摘要,
中文摘要
基因選擇是機器學習和生物信息學中的重要課題。從高維小樣本的基因數據集中發現與疾病相關的關鍵基因有助於提高癌症識別的準確性。本項目研究基於Lp(0
結題摘要
項目按照申請書計畫進行,在基於Lp正則化支持向量機的基因選擇方法及相關的數值計算方面,取得了如下成果:(1)研究基於Lp-SVM(0<p<1)的特徵選擇方法,將其轉換為等價的光滑約束最最佳化問題,證明模型間的等價性和其良好性質,為求解非光滑非凸且非Lipschitz連續的Lp正則化問題開闢新的途徑。數值實驗表明,自適應的p值可以根據數據選擇模型,從而提高模型的稀疏性和分類的準確性。對於p=0.5的特殊形式,研究適合於大規模問題的序列線性規劃方法,具有好的數值結果,為解決高維小樣本基因表達譜數據的學習問題提供有效工具。(2)研究具有組選能力的正則化模型以及基於圖的特徵選擇方法,探索了結構化特徵選擇的途徑。(3)研究求解大規模非線性方程組和最最佳化問題的稀疏擬牛頓法,理論證明了算法的全局收斂性,所提出的算法都進行了數值檢驗,在函式值計算次數, 梯度值計算次數和計算時間方面均有較好的表現,使得設計更高效的學習算法成為可能.