《大豆RNA結構與進化分析的信息處理方法研究》是依託哈爾濱工業大學,由郭茂祖擔任項目負責人的重點項目。
基本介紹
- 中文名:大豆RNA結構與進化分析的信息處理方法研究
- 依託單位:哈爾濱工業大學
- 項目類別:重點項目
- 項目負責人:郭茂祖
項目摘要,結題摘要,
項目摘要
本項目基於機器學習和組合最佳化算法等信息理論,研究RNA結構預測與進化分析。主要針對目前信息方法準確度低、大豆序列數據兼有EST和基因組特性這兩個問題,給出結合生物背景知識的字元串聚類算法,以提高敏感性和效率;建立適宜比較的RNA二級結構表示方法,並研究結合類別信息的結構預測算法,避免預測的盲目性;發展基於機器學習挖掘非編碼RNA的方法,包括挖掘microRNA的多示例學習算法等;建立搜尋無全基因組植物的RGA的方法,以挖掘PR基因;提出在EST序列中挖掘SNP位點的新方法,用於大豆優質育種;針對序列數據的比對情況,分別建立漸進式和基於quartet的進化關係構建方法,以適應處理大規模數據。通過與目前同類軟體的比較研究、以及大豆分子生物學實驗,驗證以上信息方法的有效性。本項研究對開拓新的生物信息學理論和方法、開發實用的計算生物學軟體系統和研究優質大豆都具有重要意義。
結題摘要
miRNA是一類長度為22-nt左右的非編碼RNA,可與目的靶基因mRNA互補,介導轉錄後水平的基因沉默、降解靶基因,起下調目的基因表達的作用,研究表明其在植物生物脅迫與非生物脅迫過程中起重要作用。針對油料作物特別是大豆生物信息處理方法在miRNA和啟動子挖掘軟體存在的效率和學習能力較低以及功能分析滯後等問題,哈爾濱工業大學郭茂祖教授和東北農業大學李文濱教授領導的課題組,在國家自然科學基金重點項目“大豆RNA結構與進化分析的信息處理方法研究(編號:60932008)”資助下,開展了miRNA前體分類和成熟體位置預測算法、生物進化樹與進化網路重構算法、抗性基因挖掘算法以及相應的大豆生物鑑定和驗證等研究工作,對發展生物信息學方法和研究大豆優質育種將具有重要意義。主要成果包括: 1.完成大豆EST與基因組、項目組自測序等數據的收集與整理;提出了雲計算並行環境下的大數據量EST聚類方法、以及基於參數過濾和集成學習的SNP位點挖掘方法,可有效降低假陽性。 2.在RNA結構分析方面,給出了表征莖區位置的RNA二級結構表示方法;提出了植物miRNA前體分類和成熟體位置預測算法,給出了結合miRNA生源論特徵提取方法,解決了正反例樣本不平衡問題,能夠為生物學家發現新miRNA提供高可靠的候選。 3.基於項目組研製軟體,預測了大豆基因組中521個新miRNA基因,克隆得到了gma-MIR390b和gma-MIR1509a基因的啟動子全長序列。 4.在進化關係分析方面,提出了疊代多對物種的進化樹重構算法,速度較快;在進化網路研究方面,提出的進化網路重構算法降低了網路對數據輸入順序的敏感性。 5.在抗性基因挖掘方面,提出了基於隨機森林的挖掘方法,克隆6個PK-LRR-TM類的胞囊線蟲抗病候選基因;利用髮根農桿菌K599轉基因方法驗證了抗病功能。 6.對東農93046×合豐25,進行簡化基因組測序獲得16,038,743個標籤和141個差異SNP標記,與樣品表型SNP標記數據關聯分析獲得25個抗花葉病毒病候選基因。 本項目共發表論文79篇,包括國際期刊論文47篇,國際會議論文17篇。授權國家發明專利3項、軟體著作權2項。獲省科技進步一等獎和省自然科學二等獎各1項。培養研究生32名,項目組通過積極參與相關領域主流國際會議、邀請國外專家訪問等方式,與國外同行進行了深入的學術交流與合作。