《全基因組重測序數據高維SNP相互作用研究》是依託吉林大學,由梁艷春擔任項目負責人的面上項目。
基本介紹
- 中文名:全基因組重測序數據高維SNP相互作用研究
- 項目類別:面上項目
- 項目負責人:梁艷春
- 依託單位:吉林大學
項目摘要,結題摘要,
項目摘要
本項目擬充分利用當前用於全基因組關聯分析的基因重測序數據,通過採用基於信息熵的群智慧型啟發搜尋、基於多聚類的數據壓縮、基於LASSO的高維特徵選擇等策略來挖掘全基因組數據中的高維SNP(核苷酸多態性)相互作用,再使用基於最大化信息熵的方法對其評估,剔除由於傳遞性導致的間接相互作用。研究由於SNP導致的蛋白結構變化、表面結合位點與docking相關信息,通過映射相關基因,融合基因注釋和Pathway信息,在序列上檢查啟動子motif和小RNA靶基因,並在此基礎上研究蛋白相互作用網路中拓撲結構變化。將獲得的高維相互作用進行系統生物學層面的信息驗證和機理闡述,進行農作物分子育種和複雜人類疾病研究。本項目將提出和研發一套全基因組的高維SNP相互作用挖掘軟體和並行計算平台,通過機理與數據的結合與分析,揭示相應性狀和複雜疾病相關的分子遺傳和代謝機理,為分子育種設計、基因組複雜性狀的分子遺傳改良提供範例。
結題摘要
本項目擬充分利用當前用於全基因組關聯分析的基因重測序數據,通過採用基於信息熵的群智慧型啟發搜尋、基於多聚類的數據壓縮、基於LASSO 的高維特徵選擇等策略來挖掘全基因組數據中的高維SNP(核苷酸多態性)相互作用,再使用基於最大化信息熵的方法對其評估,剔除由於傳遞性導致的間接相互作用。研究由於SNP導致的蛋白結構變化、表面結合位點與docking 相關信息,通過映射相關基因,融合基因注釋和Pathway信息,在序列上檢查啟動子motif 和小RNA 靶基因,並在此基礎上研究蛋白相互作用網路中拓撲結構變化。將獲得的高維相互作用進行系統生物學層面的信息驗證和機理闡述,進行農作物分子育種和複雜人類疾病研究。本項目將提出和開發一套全基因組的高維SNP相互作用挖掘軟體和並行計算平台,通過機理與數據的結合與分析,揭示相應性狀和複雜疾病相關的分子遺傳和代謝機理,為分子育種設計、基因組複雜性狀的分子遺傳改良提供範例。 項目組在國內外有影響的學術刊物或國際會議上公開發表高質量學術論文33篇,其中SCI 收錄論文29篇,獲得發明專利1項,軟體著作權7項。完成了一系列基於組學數據的生物信息學模型及其套用軟體開發,構建了一系列基於生物序列分析計算模型,完成了一系列生物醫學文本挖掘相關算法構建及其套用軟體開發,並且進一步構建了一系列的機器學習和模式識別的算法模型,促進了生物信息學的發展。組織國際學術系列會議4次,組織龍星計畫課程4次,這些會議和課程的成功舉辦,不僅為國內外生物信息學、系統生物學、統計遺傳學等領域的專家學者、專業人員和研究生提供了一個互相交流的平台,提高了相關研究人員的生物信息學研究水平,也為促進吉林大學與國內外同行在生物信息學研究前沿領域的合作起到了積極的推動作用。