《基於隱馬爾科夫模型的癌症關聯基因調控通道建模研究》是依託中國科學院合肥物質科學研究院,由王紅強擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於隱馬爾科夫模型的癌症關聯基因調控通道建模研究
- 項目類別:青年科學基金項目
- 項目負責人:王紅強
- 依託單位:中國科學院合肥物質科學研究院
項目摘要,結題摘要,
項目摘要
本項目擬主要基於隱馬爾科夫模型(HMM)建模癌症關聯基因調控通道(Regulatory pathway),並在此基礎上進一步研究基於基因表達譜的癌症診斷問題。首先,結合來自蛋白質組、新陳代謝組等數據的相關先驗信息使用Bayesian、EM方法研究基於調控機率模型(RPM)的基因調控信息提取方法,構建基於RPM的基因評價準則;然後,在有效利用基因調控信息的基礎上,研究基於獨立變數群分析(IVGA)的調控通道基因子集識別方法,構建基於RPM的調控通道評價準則;接著,依據所識別的調控通道基因子集,結合調控機率模型,研究基於隱馬爾可夫模型的癌症單調控通道建模方法,並基於加權集成策略研究癌症多通道調控機制、編碼癌症調控特徵;最後,在上述分析和建模的基礎上開發基於多通道調控模型的癌症診斷軟體系統。本項目的深入研究將為系統地揭示癌症本質開闢新的途徑,並為個性化醫學的研究與發展打下基礎。
結題摘要
經過課題組三年緊張的科研攻關,該課題所有擬定的科研任務已經順利完成,項目研究取得了預期的研究成果。從取得的研究成果來看,開展該課題的研究,立項的切入點好,選題正確,可行性好,具有很強前瞻性。在整個研究過程中,我們緊緊圍繞課題的研究目標,始終把握項目研究方案的主線,按照既定的研究計畫從多個層面進行癌症病理的建模方法研究。特別的,在研究實踐中,我們還結合最新的機器學習方法探索癌症病理,拓展了研究範圍,豐富了研究內容。目前,絕大部分的研究成果已經公開發表,並且得到了國際同行的認可。 概括來說,本項目首先從GEO等開放生物數據資源收集並整理多種癌症類型基因表達數據,通過與KEGG中的通路圖譜相關聯建立了適用於腫瘤基因通路建模方法研究的基因表達數據平台(二級基因表達資料庫)。在該平台數據的基礎上,開展腫瘤建模方法研究,提出了新的基因表達數據離散方法,基因通路HMM模型等一系列基因通路分析方法。同時也在腫瘤分類與診斷、腫瘤差異表達基因的識別、基因關聯關係識別三個方面的開展了大量的套用研究工作,取得了顯著成果。值得特別一提的是,所提出的新穎的線性\pi_0估計模型,通過與加權組合策略相結合大大提高了腫瘤差異表達基因識別的準確率;所提出的基於流行學習的蛋白質相互作用關係預測方法,創新性地使用流形嵌入映射來提取網路的結構信息,結果大大提高了基因關聯關係識別的精度。這兩項重要研究成果都發表在生物信息學領域頂尖SCI雜誌《Bioinformatics》(IF=5.46)上,直至目前,它們的引用次數分別為5和13次(GoogleScholar)。整個項目目前已經發表了國際SCI、EI雜誌文章17篇,EI、ISTP國際會議文章19篇,申請發明專利一項。另外,在該項目的支持下,課題組獲得安徽省自然科學技術一等獎獎勵一項,申請到國家自然科學基金重點項目一項、王寬成海外人才科研獎勵項目一項。 總的來說,本項目從信息和計算的角度出發,使用隱馬爾科夫模型研究癌症基因通路活性,通過我們的研究發現,基因通路在細胞癌變過程中發揮重要作用。基於真實數據,我們識別出了一些腫瘤標誌物,所提出的計算模型能夠依靠較少的基因對癌症進行有效的亞型分類和早期預測。所有這些成果將為改善腫瘤臨床診斷效果和研製抗癌新藥物提供重要依據和參考,具有潛在的臨床套用價值。本項目已經取得了大量的研究成果,達到了預期研究目的。