《代謝組學數據解析方法用於肺癌早期診斷》是依託華中師範大學,由周燕平擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:代謝組學數據解析方法用於肺癌早期診斷
- 項目類別:青年科學基金項目
- 項目負責人:周燕平
- 依託單位:華中師範大學
項目摘要,結題摘要,
項目摘要
代謝組學數據解析為代謝組學研究中至關重要的步驟。本項目擬針對代謝組學數據解析不確定性的現狀,充分考慮代謝組學數據的固有特性(如,高維、高噪、小樣本以及易含奇異樣本和非線性等),以傳統化學計量學方法為基礎,引入並完善機器學習領域中的樹形算法、全局最佳化和模型組合技術,發展代謝組學數據預處理、模式識別等分析算法,同時,結合核磁共振技術,開展代謝組學技術在肺癌早期診斷中的套用研究。力爭通過算法的構建及其套用研究,獲得多種適合於代謝組學數據特性的高性能的生物化學計量學方法,建立高通量代謝組學數據分析的信息學理論和方法,為後基因組時代功能基因研究提供有效而實用的工具,同時,發現潛在的肺癌標誌物,為肺癌早期診斷提供指導,此外,本項目研究還能豐富化學計量學基礎理論,提升化學計量學的套用價值。
結題摘要
項目開展三年來,我們已全部完成該項目計畫內容,達到了預期的研究目標。 在本項目中,針對肺癌危害性大,且其早期診斷尚缺乏特異性標誌物的這一問題,我們選取了血清為研究對象,採用核磁共振波譜為測量手段獲取了正常組和肺癌組(包括治療後復發組和新診斷未經治療組)的血清樣本1H NMR譜圖。同時,針對代謝組學數據解析不確定的現狀,充分考慮代謝組學數據的固有特性,以傳統的化學計量學算法為基礎,引入並完善機器學習領域中的樹形算法、全局最佳化算法和模型組合技術,成功發展了多種適合於代謝組學數據特性的化學計量學算法,並將其用於肺癌代謝組學數據解析,新發展的算法包括引入粒子群最佳化算法(PSO)構建了全局最優的偏最小二乘-判別分析(PSO-PLSDA和PSO-SVWL-PLSDA)和分類樹(PSOCT);引入Adaboost.M2來提高PLS-DA性能(BPLSDA.M2);為提高被組合的子模型間的差異性,改善組合效果,結合PSO與組合技術(bagging),用於提高分類樹性能(PSOBAGCT);採用bagging組合不同建模算法,即PLS-DA、徑向基函式網路和分類樹,構建一個性能優良的組合模型(BPRC)。 本項目中所構建的數據解析方法用於肺癌血清代謝組學數據解析的結果表明:各類血清樣本間的代謝差異能被準確識別,同時,乳酸、糖蛋白、脯氨酸、谷氨醯胺和丙氨酸、蘇氨酸被顯示在疾病組中的含量要明顯高於健康組的含量,而相對於正常組而言,蛋氨酸、脂質體和三甲胺在肺癌患者中顯示了明顯低的含量。同時,三甲胺和脂質體在兩疾病組中顯示了顯著性的差異。且各種算法獲得結果基本一致,並與文獻一致的。 因此,在本項目中,通過算法的構建及其套用研究,我們成功獲得了多種適合於代謝組學數據特性的高性能的生物化學計量學方法,建立了高通量代謝組學數據分析的信息學理論和方法,為後基因時代功能基因研究提供有效而實用的工具,同時,發現了部分潛在的關鍵性的肺癌標誌物,為肺癌早期診斷提供指導;此外,本項目中發展的多種新型的建模算法也豐富了化學計量學基礎領域,提升了化學計量學的套用價值。