《代謝組學中的生物啟發式高維數據特徵選擇方法研究》是依託深圳大學,由紀震擔任項目負責人的面上項目。
基本介紹
- 中文名:代謝組學中的生物啟發式高維數據特徵選擇方法研究
- 項目類別:面上項目
- 項目負責人:紀震
- 依託單位:深圳大學
項目摘要,結題摘要,
項目摘要
代謝組學中的高維數據由於特徵空間維數過高,傳統最佳化搜尋算法都很難在短時間內找到令人滿意的特徵子集,如何提高代謝組學的多變數數據分析性能,成為信息學專家和生物學家面臨的新問題。以更加有效的高維特徵選取方式,用較小的實驗樣本完成代謝組高維數據集的多變數分析是必然的選擇。.本項目是研究基於生物啟發式Memetic算法的代謝組學高維特徵選擇算法,將建立基於生物啟發式Memetic算法的高維特徵選擇框架,給出適合於代謝組學高維數據特徵的過濾式可分解局部搜尋、自生式編碼、快速特徵子集評估函式的設計方法,針對代謝組學中NMR圖譜數據和一維/二維質譜數據的不同性質,實現通用高效的代謝組學高維數據特徵選擇系統,整體提高代謝組學高維數據的多變數分析性能。.本項目將首次充分研究和利用Memetic算法高維特徵選擇的突出能力,將國際上代謝組學高維數據特徵選擇研究從傳統的統計學最佳化拓展到生物啟發式智慧型最佳化階段。
結題摘要
代謝組學中的高維數據由於特徵空間維數過高,傳統最佳化搜尋算法都很難在短時間內找到令人滿意的特徵子集。如何提高代謝組學的多變數數據分析性能,成為信息學專家和生物學家面臨的新問題。以更加有效的高維特徵選取方式,用較小的實驗樣本完成代謝組高維數據集的多變數分析是必然的選擇。 本項目是研究基於生物啟發式Memetic算法的代謝組學高維特徵選擇算法,將建立基於生物啟發式Memetic算法的高維特徵選擇框架,給出適合於代謝組學高維數據特徵的過濾式可分解局部搜尋、自生式編碼、快速特徵子集評估函式的設計方法,針對代謝組學中NMR圖譜數據和一維/二維質譜數據的不同性質,實現通用高效的代謝組學高維數據特徵選擇系統,整體提高代謝組學高維數據的多變數分析性能。 本項目首次充分研究和利用Memetic算法高維特徵選擇的突出能力,將國際上代謝組學高維數據特徵選擇研究從傳統的統計學最佳化拓展到生物啟發式智慧型最佳化階段。提出了啟發式運算元鏈MA特徵加權算法、基於Memetic Computing的多變數聯合熵特徵選擇算法等一系列方法,並套用於等位肝移植代謝組Microdialysis-HPLC質譜數據、人類2型糖尿病尿液代謝組NMR數據等的分析中,獲得了優於現有技術的生物標誌物提取結果。可有效支撐生物學及醫學等領域的後續研究。