《核矩陣學習的最最佳化方法及其在生物信息學中的套用》是依託中國農業大學,由經玲擔任項目負責人的面上項目。
基本介紹
- 中文名:核矩陣學習的最最佳化方法及其在生物信息學中的套用
- 依託單位:中國農業大學
- 項目負責人:經玲
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
作為核函式問題的推廣,核矩陣學習可以更加細緻地描述樣本點間的關係,因而更符合實際情況,已成為當今數據挖掘領域的一個的研究方向。它的理論研究和實際套用正在快速的發展,最最佳化方法是其主要工具之一。本項目擬從最最佳化角度研究核矩陣學習的問題,特別注意核矩陣學習問題的新模型和其最最佳化方法。研究內容包括兩分類問題中,基於支持向量機型方法的最最佳化模型及其求解等問題,以及在其他數據挖掘問題(多分類、聚類、回歸等)的推廣。在套用領域將針對生物信息學中的具體問題構建核矩陣學習模型並進行相應的最最佳化算法研究。目前對核矩陣學習的研究和套用剛剛起步,還未有從最最佳化理論和方法角度出發的研究工作。因此,本項目的研究無論是對核矩陣學習理論還是實踐方面,都很有意義。
結題摘要
核矩陣學習可以更加細緻地描述樣本點間的關係,因而更符合實際情況,已成為當今數據挖掘領域的一個的研究方向。本項目從最最佳化角度研究核矩陣學習的問題,特別注意核矩陣學習問題的新模型和其最最佳化方法。2012年由CRC Press公司出版了我們的英文專著《Support Vector Machines—Optimization based Theory,Algorithms, and Extensions》。此外,項目推廣了現有核矩陣學習模型,提出了基於支持向量機型的多核新模型;討論了實際套用時多個核函式的構成問題;提出了基於標籤的多核學習模型;對於基於網路的多核學習問題;對多分類問題結合局部和樣本標籤信息也建立了新模型;利用變間隔技術改進了中心支持向量機模型;根據一致性原則改進了中心支持向量機模型;針對張量類型的數據,也建立了直接解決張量數據輸入的支持張量機新模型。我們還研究了雙子-支持向量機的各種推廣形式,如建立了統一範數意義下的Twin-SVM新模型;建立了最小二乘意義下的遞推投影Twin-SVM模型;建立了分類問題的最小二乘變間隔Twin-SVM模型;建立針對回歸問題的ε-敏感Twin-SVM模型;給出了基於機率輸出的Twin-SVM模型;建立了基於梯度下降的Twin-SVM新算法;建立了基於超鬆弛法和微分進化理論的Laplace-TwinSVM新算法;推出了組合Twin-SVM方法等。另外,我們還對半監督分類問題進行了研究。針對一類特殊情況的半監督問題PU問題,分別改變輸出為機率;基於圖的概念,對無標籤的樣本點進行了更細的劃分建立了新模型;引入密度的概念解決了半監督的PU問題;改進了標準的最小二乘支持向量機使之能夠解決PU問題;結合局部學習的思想,建立了局部學習的半監督分類器等。在套用方面,我們主要研究核矩陣學習方法在生物信息學等方面的套用。利用多核學習研究了蛋白質位點的預測問題;利用支持向量機研究了蛋白和蛋白相互作用的預測問題;根據蛋白和蛋白的相互作用網,以及蛋白和藥物的相互作用網,對蛋白和藥物的相互作用進行了預測;基於多核學習的支持向量機模型,巧妙地構造了反映基因組特徵的多個核函式,研究了基因的網路特徵選擇問題;將潛在因子分析法模型套用於結腸癌的致病基因的選擇問題。 期間共指導碩、博研究生18人,發表專著和論文45篇,並多次參加國內外重要科研學術活動。