基於糾錯編碼理論的最小基因組設計方法的研究

中文摘要

最小基因組研究在化工、製藥、能源等領域具有重要套用價值，對生命的起源、進化和代謝控制等問題的研究具有重要意義。本項目以基因之間、基因與非編碼區序列片段之間糾錯約束關係為研究對象，利用現代通信工程的糾錯編碼理論研究基因組之間蘊含的糾錯編碼機制，研究必要基因判定規則，指導最小基因組設計。.本項目要回答以下問題：糾錯編碼中的分組碼、卷積碼和級聯編碼模型能否反映基因之間、基因與非編碼序列片段之間在糾錯編碼意義上的相互影響關係？各模型的最佳模型參數和數據分析模式？本項目是對我們提出的如下理論進行驗證：遺傳信息自身具有複雜的糾錯機制，某些基因的存在確保了另一些基因在遺傳過程中的信息健壯性（抗干擾能力強）。可由此判定必要基因，確定最小基因組，建立一種必要基因的分析規則。.開展本項目有助於研究最小基因組設計方法；探索合成基因組研究過程中安全問題的解決方法；借鑑生物遺傳信息編碼方式最佳化通信領域編碼理論。

結題摘要

一、相關研究情況： 1、研究遺傳信息單元之間在糾錯意義上的相互影響關係極具意義，對我們理解遺傳序列信息單元之間的相互作用和影響可以提供一個新的視角，為我們利用通信工程的編碼理論改造遺傳序列，具有指導作用。我們借鑑通信編碼理論中編碼模型的設計、分析方法，結合分子生物學中密碼子簡併性、密碼子上下文關聯性、鹼基短程關聯占優等生物學特性：（1）設計了一種基於分組碼最小碼距的分析模型。對識別mRNA 引導序列、對翻譯起始準確定位，以及在蛋白質翻譯過程中識別開放閱讀框具有較好效果。（2）設計了一種卷積碼分析模型。對翻譯起始、終止，原核生物的SD區域有較好識別能力。我們在實驗中建立一個新參數：特徵平均碼距(CACD)，與原核生物GC含量具有較好的比例特性。 2、現階段研究中，僅僅用編碼的參數（如碼距、碼重等）對生物序列進行描述，不足以刻畫生物序列的複雜性，對必要/非必要基因進行描述。因此開展了對必要/非必要基因的描述特徵的探索。（1）提出一種直接將Hurst指數作為指標參數進行DNA序列相似性分析的方法。（2）對多個細菌的必要、非必要基因與完全基因集合的Hurst指數的統計特性進行了分析，其統計分布特性具有顯著差異。（3）對多種原核生物進行蛋白質亞細胞定位的數值定量分析，觀察到在不同細胞器和細胞區域，必要/非必要基因中含有的某些蛋白質含量的比例有明顯的數值範圍分布。上述結果可以在細菌必要基因的計算機輔助設計中，對設計必要基因組提供支持。 3、信號表達是生物信號過程中的重要環節，可對分析結果產生明顯影響。基於符號動力學原理，提出了一種圖形表示RNA二級結構序列的方法，並在RNA二級結構序列的相似度分析中初步驗證了其有效性。 4、基於線性代數中矩陣秩的理論和伽羅華域運算規則，提出一種新的DNA序列短串聯重複線性定位辦法。 5、根據項目研究目的中對合成生物安全問題的考慮，我們對合成生物學及其安全監管問題的研究進展保持跟蹤，並對現有研究情況、涉及的安全風險以及相關研討及對策分析進行了整理。二、項目運行情況以上研究結果，發表文章6篇，其中SCI收錄2篇，EI收錄1篇，CSCD收錄3篇；申請發明專利1項。先後直接協助培養參與本項目的博士後1人，博士2人，研究生3人。此外，參加國內學術會議2人次，參加國際學術會議2人次。

基於糾錯編碼理論的最小基因組設計方法的研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條