《基於高維短序列生物數據的系統重構研究》是依託蘇州大學,由馬歡飛擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於高維短序列生物數據的系統重構研究
- 項目類別:青年科學基金項目
- 項目負責人:馬歡飛
- 依託單位:蘇州大學
項目摘要,結題摘要,
項目摘要
系統生物學的一個重要目標是從系統的角度來認識各個層次的生物學現象,而探索和理解生物系統的一個重要手段是通過分析海量的各層次多種類的實驗數據特別是生物系統的時間序列數據來重構系統的各種動力學行為。目前已有的數理方法主要集中於對低維長時間序列數據的動態行為研究,而對於以基因晶片等高通量生物數據為代表的高維短時間序列數據還缺乏相應的分析和重構手段。本項目通過理論研究、算法設計及結合實驗結果,旨在獲得針對高維短時間序列數據的系統重構方法,主要包括研究高維短時間序列數據的可靠預測和歷史追溯以實現數據的動力學重構;研究短時間序列變數間的因果關係檢測以實現系統調控網路的重構;研究基於短測量數據的大規模參數識別算法以實現系統模型的重構;並套用以上理論算法來研究II型糖尿病高通量數據的信息挖掘以驗證和探索疾病的機制和治療方法。
結題摘要
如何從系統生物學的大量數據中挖掘出系統有用信息,如重構出系統的動力學模型,推斷出因果關係並和重構出調控網路,辨識各層面各類別的參數,是探索和理解生物系統的一個重要手段和有意義的數理問題。本項目主要針對高維短時間序列數據,研究生物系統的重構方法,旨在開發出一套基於非線性科學的通用方法,並用於解決實際問題。 在本項目執行期間,針對項目計畫中計畫的三個主要問題,即系統預測,因果推斷及網路重構,參數辨識及模型重構,分別展開了相應的研究並獲得了預期的成果。對於系統預測,我們開發一套基於嵌入定理的逆向嵌入方法,特別針對高維短數據提供了預測的可能;對於因果推斷,我們發展了近期國際上的研究熱點,即基於交叉映射的因果推斷方法,開發了光滑交叉映射檢測方法,將檢測所需要的時序列最短長度從至少O(10^3)大幅降低到O(10),成果獲得了很多國際同行的關注;對於參數辨識與模型重構,我們提出了未知不穩定點的隨機檢測方法,克服了傳統方法需要預先知道不動點種類的檢測條件,可以通過一套統一的方法將所有種類的不動點同時穩定化並檢測出來,並刻劃出穩定化後的不同不動點各自的吸引域。上述三個主要問題的研究成果分別發表在三個SCI雜誌上,目前還有兩篇論文正在投稿評審中。