《代謝組學數據挖掘方法研究》是依託鄭州大學,由申琦擔任項目負責人的面上項目。
基本介紹
- 中文名:代謝組學數據挖掘方法研究
- 項目類別:面上項目
- 項目負責人:申琦
- 依託單位:鄭州大學
項目摘要,結題摘要,
項目摘要
代謝組學數據的信息提取分析是代謝組學研究的重要內容。本項目擬依據高通量代謝組學數據的高維、複雜特性,針對代謝組學數據預處理、解析不確定性的現狀,開展數據預處理、重疊色譜峰解析、區域分辨、生物標誌物簇的特徵提取、代謝指紋模式的聚類分析、判別和相關分析、數據整合算法研究,發展基於廣義二維相關分析和循環投影的數據分辨、模糊相關和鄰域交疊機率的標誌物提取、空間相關加權和量子混沌網路模式識別、混合分布估計的數據整合等一系列代謝組數據解析的新型生物化學計量學方法,建立高通量組學數據相關的生物信息學理論與方法,系統分析神經細胞退行性老年痴呆、心血管疾病、肝癌等疾病的代謝組數據,開展代謝標誌物簇識別、代謝表型變化與外源刺激關係、疾病診斷、亞型識別、藥物篩選、藥效及毒性評價等方面的套用研究,為系統生物學研究和生物系統的全面深入闡釋提供有效而實用的方法學和技術基礎。
結題摘要
對代謝混合物的複雜光譜數據進行有效的信息提取是代謝組學研究的重要內容。本項目依據高通量數據的高維、複雜特性,發展了一系列代謝組學數據解析的新型生物化學計量學方法。建立了適應度判別式的生物標誌物特徵提取方法,提出了改進的高斯混合模型和高斯混合回歸方法,為篩選相關的標誌物特徵提供了新手段;發展了雜交粒子群最佳化的均值聚類算法、基於基因表達式編程的投影判別分析法和基於人工蜂群算法最佳化的高斯混合模型和回歸方法,為代謝組指紋模式分析提供了新方法;建立了基於粒子群最佳化的自適應模糊c均值方法同時提供分類和半定量結果;將所提出的算法成功的套用於代謝組學數據、食品分析等多種套用研究,為代謝組學分析提供了有效的技術支持,具有廣闊的套用前景。