《大豆的全基因組規模代謝網路重構》是依託吉林大學,由時小虎擔任項目負責人的面上項目。
基本介紹
- 中文名:大豆的全基因組規模代謝網路重構
- 項目類別:面上項目
- 項目負責人:時小虎
- 依託單位:吉林大學
項目摘要,結題摘要,
項目摘要
本項目擬採用功能注釋和模板同源映射等方法構建大豆的全基因組規模代謝網路,基於複雜網路理論對代謝網路的動力學性質進行分析,並利用所構建的基因組規模代謝網路進行大豆的實用性分析。首先運用網路爬行和半監督機器學習文本挖掘技術進行文獻挖掘和數據融合,採用基因組注釋方法構建初始的代謝網路模板,並採用模板映射方法將其他物種代謝通路映射到大豆物種上。進一步採用流量平衡分析方法和複雜網路理論構造和剖析代謝網路的數學模型,使得模擬的結果更準確。最後採用機器學習方法對所構建的代謝網路進行評估與修正。還將利用所構建的全基因組規模代謝網路,對大豆的油料產出、營養物含量及產量等方面進行實用性分析。本項目將開發若干有關代謝網路建模與分析的新算法,並嘗試複雜物種全基因組規模通路的構建與分析。提出了構建大豆全基因組層面的代謝網路圖,將為大豆產業帶來前瞻性和深遠的影響,並為其它作物的基因工程提供指導性建議和參考範例。
結題摘要
從相關公共網站蒐集了大量大豆相關的基因組數據和代謝組數據,同時研究數據去噪和標準化方法。通過借鑑“基於快速搜尋和發現密度峰值的聚類算法”的思想,將其擴展到複雜網路社區發現問題中,我們提出了一種“基於密度峰值的重疊社區發現算法”。針對生物醫學文本挖掘和網路分析,提出一種半監督的吸引子傳播算法(SSAP),大大減小了計算量,並充分利用了已知信息。提出的重採樣集成學習算法(REA)可以通用於不均衡數據的分類問題,對於多分類問題採用基分類器集成,可以有效地提高集成分類器算法的性能。基於開放閱讀框的長度與覆蓋率,以及開放閱讀框中的多聯鹼基頻率,提出了一個新的lncRNA識別算法,並開發可提供多物種支持、具有高效率、可多平台使用等優點的新工具。構建了基於RNA的triple-vector表示下的多尺度相似性結構比較的網路服務平台,主要包括三個功能模組:1)一種新型的RNA二級結構的可視化工具,2)RNA的結構突變分析,3)多RNA的結構比較,並基於RNATV-curve構建進化樹。使用GEO資料庫中GPL4592平台下大豆鏽病相關的基因表達數據,對數據進行預處理,篩選差異表達基因並構造出了大豆基因網路圖G,並用改進的SpeakEasy算法進行了社區劃分。之後,用DAVID線上分析工具對社區劃分結果進行了功能富集分析。分析出了鏽病病菌影響大豆生長的機理和大豆在鏽病環境下的一些應激反應。