DNA甲基化異常的分析與預測研究

DNA甲基化異常的分析與預測研究

《DNA甲基化異常的分析與預測研究》是依託杭州電子科技大學,由楊昆擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:DNA甲基化異常的分析與預測研究
  • 項目類別:青年科學基金項目
  • 項目負責人:楊昆
  • 依託單位:杭州電子科技大學
項目摘要,結題摘要,

項目摘要

DNA甲基化的許多關鍵問題有待突破,有關DNA甲基化的研究已成為前沿研究的熱點。近來高通量檢測技術產生了大量的DNA甲基化數據,對數據的分析與挖掘提出了巨大的需求。本項目將以DNA甲基化數據的分析與挖掘為核心,探討DNA甲基化異常區域的隨機性、疾病相關的甲基化異常基因的預測、DNA甲基化的疾病公共模式的挖掘三個新問題,研究DNA甲基化異常區域的隨機性的定量分析模型與方法;研究甲基化異常基因的模式特徵的識別方法,挖掘基因的甲基化異常與表達變化的關係,構建甲基化異常基因的預測方法;研究DNA甲基化的疾病公共模式的挖掘理論與挖掘方法。本項目的研究將有助於探索DNA甲基化機制並為疾病的診斷和治療提供線索;所提出的理論與方法將為生物數據分析研究提供新的思路和借鑑。

結題摘要

關DNA甲基化的研究已成為前沿研究的熱點.作為重要的表觀遺傳修飾DNA甲基化對基因表達發揮重要的調控功能.本項目圍繞DNA甲基化和基因表達開展工作.把集成分析來自相同問題的不同數據來識別表達不穩定基因這一問題形式化為一個非線性整數規劃問題,提出三個啟發式的算法來求解這一最佳化問題;進一步地設計了一個統計量來度量基因的不穩定表達的程度;實驗的結果顯示所提出的方法是有效的.現有的基因選擇方法沒有綜合考慮樣本不平衡和基因間的相互作用.考慮了樣本不平衡和基因間的相互作用,借鑑聚類的驗證技術提出了基因選擇的0-1規劃模型;進一步地根據0-1規劃模型的特點,給出基於貪心思想的啟發式算法;在三個真實的基因表達數據上對提出的方法進行測試並與兩個對照的方法比較,結果表明所提出模型和算法是有效的且穩健的.交叉驗證是估計預測誤差的重要技術,然而交叉驗證的重複次數往往由經驗值給定.因為數據不同、隨機分割分數、具體的分類器都會影響誤差的估計,這種經驗地設定重複次數的方法是不可靠的.根據隨機抽樣的近似置信區間估計理論,出兩個確定交叉驗證的次數的方法;和傳統的經驗給定重複次數的值不同,我們的方法會隨著數據、分割份數、分類方法的變化自動調整,適應性更強.提取特徵是DNA甲基化狀態預測中的一個關鍵步驟,然而不同的方法所使用的特徵並不相同,特徵量化的具體過程計算繁瑣.集成文獻中的重要特徵,本項目設計並實現了DNA序列的特徵提取軟體工具.該軟體封裝了特徵的計算過程,可以方便地批量計算目標序列的相關特徵,為後續的數據分析和挖掘提供便利.目前預測和分析DNA甲基化的研究所用的特徵存在差異,缺少統一比較和評價;對非CpG島序列缺少分析.為了統一比較和評價, 本項目集成DNA甲基化的主要特徵對CpG島和非CpG島序列進行分析,並利用特徵選擇技術識別緊湊的特徵子集.結果表明序列模式和組蛋白修飾都是關聯DNA序列甲基化的重要特徵,兩者共同參與維持序列的甲基化模式;H3K4me3同時是CpG島序列和非CpG島序列最重要的組蛋白特徵,具有最高的識別頻率. 本項目識別的DNA甲基化重要特徵在生物學上具有重要功能,可以作為線索來研究 DNA 甲基化、組蛋白修飾和基因調控間的關係.

相關詞條

熱門詞條

聯絡我們