《基於投票機制的非編碼RNA“從頭預測”識別方法研究》是依託廈門大學,由鄒權擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於投票機制的非編碼RNA“從頭預測”識別方法研究
- 項目類別:青年科學基金項目
- 項目負責人:鄒權
- 依託單位:廈門大學
項目摘要,結題摘要,
項目摘要
從頭預測方法是目前挖掘非編碼RNA的主要方法。由於從頭預測方法需要利用機器學習中的分類器,而目前的分類器不能較好地處理非編碼RNA識別中的正反例不平衡現象。因此,本項目提出了基於投票機制的不平衡數據處理方法,並結合有效的特徵,實現在基因組、EST和下一代測序技術得到的數據中挖掘microRNA和snoRNA。通過對這兩種不同特點的非編碼RNA進行研究,期望能夠為其它的非編碼RNA挖掘方法提供借鑑。本項目擬:(1)提出基於投票機制的不平衡數據分類方法;(2)開發可以處理不同類型數據的microRNA和snoRNA的挖掘方法和系統;(3)在海洋類非模式生物中挖掘10條以上新的非編碼基因;(4)發表SCI期刊論文1-3篇。
結題摘要
“基於投票機制的非編碼RNA挖掘方法研究”(編號:61001013)是國家自然科學基金青年基金項目,研究期限為3年。本項目目標是研究和發展集成學習算法,並套用於非編碼RNA、尤其是microRNA的挖掘中,重點在於提高microRNA挖掘的準確率並降低假陽性,同時研究基於投票機制的集成學習方法,爭取用於解決更多的生物信息預測問題。經過了3年的努力,項目組在microRNA挖掘和集成學習方法上都取得了重要成果。項目組提出了循環最佳化反例集的思想,提高了人類microRNA挖掘的準確率,並在家蠶中挖掘到全新的microRNA,其中3條被權威資料庫miRBase收錄。在集成學習方法的研究中,項目組提出了通過聚類和循環添加選擇基分類器的策略,並開發了相應的軟體libD3C套用於若干生物信息學問題中,取得了良好的效果。本項目共發表論文40篇,其中SCI收錄17篇,EI收錄10篇,獲得軟體著作權10項,畢業研究生6人,並獲得了基金委的青年-面上連續資助項目。