基於單體型的基因統計關聯分析

《基於單體型的基因統計關聯分析》是依託中國科學技術大學,由楊亞寧擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於單體型的基因統計關聯分析
  • 項目類別:面上項目
  • 項目負責人:楊亞寧
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

複雜疾病的基因關聯分析關鍵在於尋找和發現多個基因在病例和正常人之間統計分布的不同。單體型作為同一條染色體上不同位點的等位基因組成的序列,是基因位點之間連鎖不平衡(LD)或相依信息的有效載體,其分布在病例與對照組之間的差異反映了多個等位基因對於疾病的共同作用。基因型數據不提供單體型的相型信息,因而基因型數據的單體型分析是一種不完全數據的統計分析方法。本項目研究以單體型為基本單位的基因關聯分析,包括利用群體中單體型的稀疏性研究單體型頻率估計的壓縮感知規則化算法;基於LD係數矩陣或複合LD係數矩陣主要特徵在病例組和對照組之間的差異,構建互動作用分析方法;基於回溯型似然函式,通過組合劃分方法降低參數空間維數,研究以單體型為基礎的高效檢驗方法;利用下一代測序技術提供的大量低頻率變異,研究貝葉斯方法以及單體型方法整合多個稀有變異的效應。本項目所研究的方法可套用於複雜疾病的全基因組多基因關聯分析。

結題摘要

本項目研究複雜疾病基於單體型的基因關聯分析。複雜疾病與多個基因和環境因素有關,發現關聯基因及其互動作用對於複雜疾病的遺傳機理分析有重要的意義。項目主要研究內容包括稀有變異的關聯性檢驗,基於新一代測序的癌症驅動基因檢測和通路分析,單體型頻率的壓縮感知估計,三元核心家係數據的穩健TDT檢驗以及藥物動力學的經驗Bayes協變數分析方法和Bayes統計分析的理論研究等內容。 在自然科學基金的支持下,我們在生物信息和基因流行病學等方面的研究中取得了一些有意義的研究成果和若干進展,發表標註論文18篇(其中15篇SCI)。主要成果如下:稀有變異的關聯分析是當前全基因組研究中的熱點問題,關聯稀有變異的發現能夠顯著地提高遺傳因素所能解釋的人類性狀變差的百分比。我們提出並研究了基於泊松逼近的統計檢驗方法、基於相對風險的變閾值合併方法以及基於似然比檢驗的變數選擇方法; 關於單體型的頻率估計我們採用壓縮感知領域的L1懲罰方法,得到了一種不同於以往基於似然理論的估計方法,該方法所使用的採樣矩陣非隨機,是對壓縮感知採樣理論的一個有益補充;關於癌症的驅動基因研究,基於癌症患者群體的異質性,我們建立混合模型並同時考慮多種變異類型,套用似然方法研究了癌細胞驅動基因和通路分析,所得到的似然比檢驗和計算方法形成了軟體DrGap;關於藥物動力學中的協變數分析,我們研究了經驗Bayes估計的壓縮性質和似然比檢驗的性質,並研究了部分有界回響變數取值於邊界情形下統計指標的制定方法及其性質。模擬分析和實際數據分析驗證了所提方法的有效性和計算實用性,部分研究結果可套用於複雜疾病的全基因組關聯分析。通過本項目的實施,培養博士生5人(畢業2人),碩士生11人(畢業8人)。

相關詞條

熱門詞條

聯絡我們