基於特徵挖掘的生物網路構建算法研究

《基於特徵挖掘的生物網路構建算法研究》是依託復旦大學,由熊贇擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於特徵挖掘的生物網路構建算法研究
  • 依託單位:復旦大學
  • 項目類別:青年科學基金項目
  • 項目負責人:熊贇
項目摘要,結題摘要,

項目摘要

系統生物學是研究生物系統中所有組成成分的構成及在特定條件下它們的相互關係的前沿學科,構建生物網路是其重要研究內容之一。目前,生物網路構建方法的準確性不高,其主要原因是:生物序列中已知功能元件的數量較少或基因表達數據質量難以保證,這將導致構建網路的關鍵步驟序列間關聯關係識別和預測的準確性難以滿足。因此,為提高生物網路構建的準確性,研究新的網路構建方法是一項重要工作。本項目採用數據挖掘技術構建生物網路:首先通過數據挖掘技術挖掘生物序列的特徵,在此基礎上建立基於多特徵的生物網路模型,然後根據該網路模型生成生物網路。這樣構建的生物網路將具有較高的準確性。主要研究內容包括:1、多種功能元件數據挖掘算法的研究;2、功能元件組合模組挖掘算法的研究;3、基因表達數據的特徵挖掘算法的研究;4、基於多特徵的生物網路模型的研究等。本項目研究有望為系統生物學中構建生物網路研究提供一個更高準確性的生物網路模型。

結題摘要

生物網路的構建與分析是系統生物學的重要內容,有助於從整體上理解生物學進程。第二代測序技術使得單個測序儀輸出數據量可達40Gb每天,大數據對生物網路分析提出新挑戰。生物網路研究的技術問題是生物學家對數據挖掘中新型技術的跟蹤和掌握不夠及時;而數據挖掘專家沒有很好理解生物網路特點。這導致數據挖掘研究領域中的最新研究成果難以直接用於生物網路構建和分析中。因此,如何結合生物領域知識和需求,利用數據挖掘領域中的新技術更有效的研究生物網路是生物信息學中的重要研究內容之一。生物序列的特徵對於構建生物網路具有重要影響,是構建生物網路的關鍵,然而,由於目前生物序列中已知功能元件數量較少以及基因表達數據質量難以保證,導致序列間關聯關係的識別和預測準確性不高,因此,影響生物網路構建的準確性。本項目圍繞這一重要問題開展了研究,深入分析了生物序列數據的特點,結合現有的數據挖掘技術,研究並設計了生物序列特徵挖掘算法,包括基於序列模式的保守功能元件挖掘算法、基於多數據域描述的非保守功能元件挖掘算法、功能元件組合挖掘算法、基因表達數據的特徵挖掘算法。在此基礎上,研究基於不同語義路徑的異質生物網路模型和構建方法,所構建的生物網路具有語義相關性。這些研究成果為生物網路分析研究提供了基礎。本項目工作進展順利,完成了項目要求的各項指標。下一步的研究將在生物網路深層次挖掘方面,包括異質生物網路的關鍵模組挖掘、基於生物網路的藥物和疾病挖掘研究等。

相關詞條

熱門詞條

聯絡我們