《分子生物學中複雜數據的若干統計分析方法》是依託中國科學院數學與系統科學研究院,由李國英擔任項目負責人的面上項目。
基本介紹
- 中文名:分子生物學中複雜數據的若干統計分析方法
- 項目類別:面上項目
- 項目負責人:李國英
- 依託單位:中國科學院數學與系統科學研究院
- 批准號:10371126
- 申請代碼:A0401
- 負責人職稱:研究員
- 研究期限:2004-01-01 至 2006-12-31
- 支持經費:24(萬元)
項目摘要
分子生物學已經積累了且繼續產生著大量的數據。這些數據維數高、噪聲強、結構複雜、相依性強、污染嚴重、數據類型也很複雜。從這樣的海量數據中提取新的生物學知識是當今科技界面臨的巨大挑戰之一,也是發展統計學的極好機遇。完全由我國自主測定的秈稻基因組數據是寶貴的資源財富。本項目擬以該數據為主要背景,研究若干重要的生物學問題和其中的統計方法,包括:基因識別中剪下位點及其他調控基因表達信號的建模和預測;基於mRNA抽樣數據和微陣列數據的基因表達數據分析;基於單核苷酸多態性研究其鄰近核苷酸效應和單體型結構;並在上述分子生物學問題的研究過程中,吸取統計學和計算機科學兩類方法的長處,改進和發展高維複雜數據的深度函式、離群點檢測、以及穩健聚類和判別等統計方法和有關的計算方法。