《生物序列數據的統計模型和算法》是依託南京航空航天大學,由劉心聲擔任項目負責人的面上項目。
基本介紹
- 中文名:生物序列數據的統計模型和算法
- 項目類別:面上項目
- 項目負責人:劉心聲
- 依託單位:南京航空航天大學
《生物序列數據的統計模型和算法》是依託南京航空航天大學,由劉心聲擔任項目負責人的面上項目。
《生物序列數據的統計模型和算法》是依託南京航空航天大學,由劉心聲擔任項目負責人的面上項目。項目摘要生物序列數據的基本特徵決定了生物序列的建模必然是基於數理統計學理論。本項目以大數據統計計算為基礎,在貝葉斯統計分析的理論框...
《統計和生物數學模型計算》介紹在農林業、生態、數量遺傳等領域常用的統計方法和模型的基本原理、計算方法及其數據分析軟體——ForStat。內容包括:ForStat簡介、數學工具、常用統計分析、近代統計模型、林業常用模型、數學規劃模型、數量生態...
生物計算是指以生物大分子作為“數據”的計算模型,主要分為3種類型:蛋白質計算、RNA計算和DNA計算,或指計算機科學和計算機工程的子領域,使用生物工程和生物學建造計算機,但是類似於生物信息學,這是一個跨學科的科學,使用計算機存儲和...
通常我們利用forward算法分別計算每個HMM產生給定觀測序列O的機率,然後從中選出最優的HMM模型。這類評估的問題的一個經典例子是語音識別。在描述語言識別的隱馬爾科夫模型中,每個單詞生成一個對應的HMM,每個觀測序列由一個單詞的語音構成...
造成生物序列數據存儲和訪問效率的低下,給生物信息數據的研究帶來一定的困難與障礙。本項目的總體思路是通過對生物序列數據的特徵以及操作的研究,建立適合生物序列數據的數據模型,並在此基礎上研究索引結構和算法,進而研究生 ...
損失提出了頻率模型平均估計中權重的選擇準則,並在理論上證明了其漸近最優性,從而將主要適用於連續觀測數據的最優模型平均理論拓展到了離散分類數據情形;對縱向數據、時間序列數據的模型平均方法研究,提出了刪組交叉驗證準則選取模型平均...
(1) 項目的背景 模體發現對生物序列中定位有意義的序列片斷起著非常重要的作用,但近年來生物序列大數據集為模體發現帶來了巨大的計算挑戰。設計適用於生物序列大數據集的時間高效的模體發現算法是當前模體發現領域的一個重要任務,有助於...
(2)進一步研究序列集分割策略,提出基於數據並行的序列比對算法(CDAM)。CDAM算法套用聚類方法分割序列集,設計最長處理時間優先算法(LPT)分發序列子集,以及設計漸進式序列子集合併策略獲得大規模序列集的比對結果。分別套用Cd-hit,UCLUST...
一般的序列比對主要是針對一級結構序列上的比較。分類 雙序列比對 在生物信息處理中,我們希望找出兩條序列S和T之間具有的某種相似性關係,這種尋找生物序列相似性關係的算法就是雙序列比對算法。我們通常利用兩個序列之間的字元差異來測定...
本書把上述的進化算法及其改進的進化算法,結合數學模型,用於解決生物多序列比對問題。全書共分為“多序列比對基礎篇”“多序列比對模擬篇”和“多序列比對參數篇”三個模組。內容簡介 本書全面系統地介紹了進化算法在生物多序列比對中的...
為單個空位的罰分。使用該模型時,原史密斯-沃特曼算法可簡化為:此時該算法步數為 分別為兩序列的長度。在對某一位置考慮空位罰分時,只需考慮相鄰的上方的和左側的位置,而不需考慮整列和整行。空位延伸罰分模型 該模型考慮空位起始...
除了序列信息外,NRL-3D包括二級結構、活性位點、結合位點、修飾位點等與蛋白質結構直接有關的注釋信息,對研究蛋白質結構功能關係和同源蛋白分子模型構建特別有用。TrEMBL TrEMBL是瑞士生物信息學研究所的蛋白質序列數據庫Swiss-Prot的一個...
然後,基於生物計算問題多元模型,結合參數計算方法、啟發式方法、數據壓縮方法和多元信息融合方法,解決生物計算中的相關熱點和難點問題,建立一套面向生物數據特徵的生物計算難解問題系統求解方法。最後,本項目將基於生物計算問題的算法研究...
微數組,脂肪組是現成的大量生物數據,我們就用數理統計方法處理這些數據得到了某種癌症的誘因.生物過程是動態過程,書中介紹了用微分方程和差分方程模型模擬這種過程的多種算法.由於生物數據部分缺失現象經常發生,最後介紹了迷失數據彌補的許多...
《高維生物數據的PLS特徵選擇方法研究》是依託福建師範大學,由游文杰擔任項目負責人的面上項目。項目摘要 基於統計計算與機器學習理論方法,針對高維數、小樣本、高噪聲、強相關和多類別的生物數據,研究偏最小二乘特徵選擇模型算法。給出...
而且SEME具有以下獨特的特點:測序數據質量越高,映射速度越快。我們評估了算法的靈敏性和特異性,這在文獻中還是首次。本項目提出綜合利用序列映射、De Brujin圖、和統計分析的基因組拼接方法,這個方法目前在拼裝高雜合度的野生水稻Rubi...
4.3.5 利用PCA/LDA進行數據降維 4.3.6 特徵選擇子集的隨機搜尋 4.3.7 利用評估集來評估選擇特徵的質量 4.3.8 可替換的統計學習方法 4.4 採用遺傳算法尋找質譜數據特徵 4.4.1 簡介 4.4.2 導入本地質譜數據到MATLAB 4.4....
在本基金的支持下,課題組在新一代測序技術下單體型組裝計算問題組合最佳化模型的構建、高效算法的設計與分析上取得了顯著的進展。通過對單體型組裝問題相關真實生物數據的整合和數據特徵的抽取,課題組完成了模擬數據生成器的設計和測試平台的...
另一方面,生物信息學也希望採用數據挖掘技術對生物數據進行分析,以期發現生物規律,因此根據生命科學的需要和領域知識,設計出有效的生物數據挖掘算法和軟體工具是一個重要的研究內容。該書系統介紹了生物數據整合與挖掘的技術框架,包括:...
然而,核酸序列編碼問題是一個困難而複雜的問題,它受到諸如相似性問題、自由能問題、解鏈溫度問題等因素的制約影響; 在DNA計算中, 還與解空間大小、解的檢測等問題的解決密切相關。本項目擬主要研究DNA計算的編碼理論、方法與算法。提出...
3.8 仿射空位罰分模型下的全局比對算法... 69 3.9 仿射空位罰分模型下的局部比對算法... 72 3.10 降價空間存儲的兩序列比對算法... 75 3.10.1 線性空間複雜性算法... 75 3.10.2 CheckPoint 算法... 77 3.11 降低時間...
研究短時間序列變數間的因果關係檢測以實現系統調控網路的重構;研究基於短測量數據的大規模參數識別算法以實現系統模型的重構;並套用以上理論算法來研究II型糖尿病高通量數據的信息挖掘以驗證和探索疾病的機制和治療方法。