《大規模SNP數據挖掘及其在複雜疾病分析中的套用研究》是依託湖南大學,由廖波擔任項目負責人的面上項目。
基本介紹
- 中文名:大規模SNP數據挖掘及其在複雜疾病分析中的套用研究
- 項目類別:面上項目
- 項目負責人:廖波
- 依託單位:湖南大學
中文摘要,結題摘要,
中文摘要
隨著SNP微陣列晶片技術的發展,全基因組關聯研究已成為識別複雜疾病致病位點的重要手段,但如何提高關聯研究的重複性,增強研究結果的解釋力是全基因組關聯研究的瓶頸問題。本項研究將利用超算平台的計算優勢,以複雜疾病SNP數據分析為基礎,融合生物通路、分子作用網路等先驗信息開展全基因組上位性研究:結合可靠參考數據的遺傳模式,挖掘複雜疾病數據的本質特徵,綜合利用降維以及聚類方法剔除噪聲數據、推測缺失數據以及稀罕SNP基因型;設計具有明確生物意義的多位點關聯度量,啟發式地構造標籤SNP子集,並構建數學模型進行性能評估,有效地從全基因組中選擇標籤SNP;基於生物通路與分子作用網路構建多層次融合分析模型,並在超算平台下設計並行算法研究多位點高階上位性,進而識別複雜疾病的多弱效致病位點;綜合利用基因本體注釋等信息解釋研究結果,進一步揭示複雜疾病的致病機理。
結題摘要
隨著SNP微陣列晶片技術的發展,全基因組關聯研究已成為識別複雜疾病致病位點的重要手段,但如何提高關聯研究的重複性,增強研究結果的解釋力是全基因組關聯研究的瓶頸問題。本項研究主要針對複雜疾病SNP數據分析方法與複雜疾病分析模型展開研究,利用超算平台的計算優勢,以複雜疾病SNP數據分析為基礎,融合生物通路、分子作用網路等先驗信息開展全基因組上位性研究:結合可靠參考數據的遺傳模式,挖掘複雜疾病數據的本質特徵,綜合利用降維以及聚類方法剔除噪聲數據、推測缺失數據以及稀罕SNP基因型;設計具有明確生物意義的多位點關聯度量,啟發式地構造標籤SNP子集,並構建數學模型進行性能評估,有效地從全基因組中選擇標籤SNP;基於生物通路與分子作用網路構建多層次融合分析模型,並在超算平台下設計並行算法研究多位點高階上位性,進而識別複雜疾病的多弱效致病位點。綜合利用基因本體注釋等信息解釋研究結果,進一步揭示複雜疾病的致病機理。