《動靜態數據相結合的基因調控網路直接因果關係辨識》是依託清華大學,由周彤擔任項目負責人的面上項目。
基本介紹
- 中文名:動靜態數據相結合的基因調控網路直接因果關係辨識
- 依託單位:清華大學
- 項目負責人:周彤
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
直接因果關係辨識是在利用實驗數據探索基因調控網路生物學特性等的研究過程中產生的一個重要理論問題。已有方法大都存在計算複雜度高、假陽/陰性率高、參數估計精度低等不足。本項目擬利用大規模網路中對單個節點直接作用的節點數通常服從冪律分布等結構特點和基因調節過程可近似分片線性描述等生物學特點,借鑑資訊理論中的 KL 距離和極大似然估計、隨機過程中的混合相依性和 Markov 鏈、系統與控制中的 Kalman 濾波和魯棒狀態估計等的思想和處理方法,研究同時利用靜態和動態實驗數據的基因調控網路直接因果關係辨識方法。研究內容包括基因調控網路的切換時刻估計、結構辨識和參數估計、最優實驗設計、冪律參數估計等,並從理論上分析估計算法的計算複雜度和統計特性、利用公共資料庫的實驗數據和公認測試問題的生物學模型和仿真數據與其它算法進行估計性能比較。研究結果將對建立複雜疾病發生模型和提高藥物研發過程效率等起到促進作用。
結題摘要
根據實驗數據和細胞生物學知識確定基因調控網路的結構是系統生物學中的一個重要問題,其結果對理解複雜疾病的成因、藥物靶標的確定等具有重要意義。通過4年左右的努力,本項目在基因調控網路結構辨識和大規模系統基本性質分析等方面取得了一些有意義的結果。主要結果如下。 1. 利用基於靈敏度懲罰的遞推魯棒狀態估計算法和線性化方法,提出了一種非線性動態基因調控網路的因果關係辨識算法。基於該辨識問題的特殊結構,從理論上證明了在一般情況下,該算法能夠給出一致估計,且收斂速度快於基於擴展卡爾曼濾波的方法。數值仿真和基於實際數據的計算結果都表明,該算法在收斂速度、估計精度等方面都優於基於擴展卡爾曼濾波和無跡卡爾曼濾波的方法。 2. 針對基因敲除實驗數據,提出了一種基於相對表達量變化的大規模基因調控網路的結構辨識方法。該方法充分利用幅度小於1的相對變化量在串聯結構中幅值遞減的特點、結合生物實驗數據信噪比低的特點,有機整合了表達量估計、零入度估計和估計值歸一化等中間過程。基於公共測試問題的計算結果表明,該方法在提高估計精度、降低計算複雜度等方面具有顯著優越性。 3. 基於均方誤差準則,推導出了一種分散式的一步狀態預測遞推算法,證明了其最優性和增益陣的唯一性,討論了其魯棒化問題,並得到了分散式魯棒狀態估計算法。同時從理論上證明了該算法的增益陣等於基於局部信息的卡爾曼濾波器的增益陣。該預測算法在一定條件下近似具有與集總式卡爾曼濾波器同樣的估計精度。 4. 基於空間連線系統的類狀態空間表示,推導出了一種僅依賴於子系統傳輸零點和連線矩陣的可控/可觀性判據。在此基礎上,建立了分散式狀態預測算法與集總式卡爾曼濾波器具有相同穩態估計精度的充分必要條件。同時還得到了大規模網路化系統便於計算的穩定和魯棒穩定的條件。 5. 針對網路化系統的信號傳輸特性,提出了一種基於靈敏度懲罰的遞推魯棒狀態估計算法,建立了該算法收斂的條件。利用正定矩陣的一種黎曼距離,給出了估計誤差的協方差陣或偽協方差陣收斂到平穩分布的條件,並推導出一個該平穩分布易於計算的高精度近似表示式。 所得結果大多以研究論文形式發表於國際學術期刊,其中10餘篇為SCI 收錄,5篇為自動化領域最具影響國際學術期刊 IEEE Trans. on Automatic Control 和 Automatica 長文 (regular paper)。