《生物序列分析的高效並行算法研究》是依託清華大學,由鄭緯民擔任項目負責人的面上項目。
基本介紹
- 中文名:生物序列分析的高效並行算法研究
- 依託單位:清華大學
- 項目負責人:鄭緯民
- 項目類別:面上項目
- 負責人職稱:教授
- 批准號:60273007
- 研究期限:2003-01-01 至 2005-12-31
- 申請代碼:F0204
- 支持經費:24(萬元)
《生物序列分析的高效並行算法研究》是依託清華大學,由鄭緯民擔任項目負責人的面上項目。
《生物序列分析的高效並行算法研究》是依託清華大學,由鄭緯民擔任項目負責人的面上項目。項目摘要針對生物序列分析中的拼接與比對等問題進行高效並行算法研究,研究序列拼接算法的高效並行化策略和方案,探索兩序列比對及多序列比對的高...
《面向異構並行系統的生物序列比對並行策略及算法研究》是依託湖南大學,由周炎濤擔任項目負責人的面上項目。中文摘要 序列比對是生物信息學中重要的基本問題,是生物信息學的基礎,可用來預測序列的功能、結構和進化過程等. 隨著大規模測序...
本項目以大數據統計計算為基礎,在數理統計、隨機過程等理論的框架之下,研究生物序列數據的統計分析、動態建模和計算,實現對生物序列信息,特別是蛋白質數據信息的推斷。我們利用兩類不同蛋白質資料庫(Pfam和SCOP)之間的映射,分別研究了...
《細胞譜系隨機演化的並行算法研究》是依託清華大學,由胡煜成擔任項目負責人的青年科學基金項目。項目摘要 隨機建模和數值模擬在系統生物學研究中已成為不可或缺的重要工具。隨著系統空間和時間尺度的增加,傳統的串列計算已無法滿足巨大的...
Sean Eddy,Janelia Farms的17個研究小組負責人之一,部分隸屬於霍華德·休斯醫學研究會,當前致力於計算基因組序列分析,使用機率論建模技術開發新算找DNA、RNA和蛋白質序列的特徵。他的主要興趣一個是識別新的結構和催化RNA,另一個是...
《生物序列大數據集模體發現算法的研究》是依託西安電子科技大學,由於強擔任項目負責人的青年科學基金項目。中文摘要 模體發現對生物序列中定位有意義的序列片斷起著非常重要的作用。模體發現的精確算法能在指定測度下找出輸入序列中最優的...
為研究面向數據特徵的高效計算方法提供了依據;2. 針對新一代測序技術和宏基因組數據,重點研究了短片段拼接、結構變異發現和高階SNP發現等生物計算問題,利用雙端讀數分布、insert size分布等特徵,設計了基於De Bruijn圖的序列組裝方法、...
測序技術的發展為分子系統發育分析帶來了海量數據。如何快速解讀海量數據,揭示生物進化規律,是國內外研究熱點之一。研究表明,高性能並行算法的研究,對於提高系統發育分析效率非常重要。然而,多維空間內的進化樹特徵複雜,似然估計千差萬別...
無論用於基因工程或生物計算等的研究,編碼設計不僅是首當其衝的問題,而且是最關鍵最核心的問題。然而,核酸序列編碼問題是一個困難而複雜的問題,它受到諸如相似性問題、自由能問題、解鏈溫度問題等因素的制約影響; 在DNA計算中, 還與...
中預測編碼蛋白基因的高效、準確的新方法;設計一種對短序列reads進行序列拼接的新算法,以期得到更長的contig甚至可能的全基因組序列;在序列片段的有效拼接和基因注釋的基礎上,進一步進行物種組分和優勢種群基因組等探索性分析。
本項目圍繞這一重要問題開展了研究,深入分析了生物序列數據的特點,結合現有的數據挖掘技術,研究並設計了生物序列特徵挖掘算法,包括基於序列模式的保守功能元件挖掘算法、基於多數據域描述的非保守功能元件挖掘算法、功能元件組合挖掘算法、...
最長樣本公共子序列用於表示基因組保守子序列,在基因組功能分析研究中具有重要意義。設計出基因組短交換排序問題判定版本的多項式算法,解決了開放10年的基因組比較領域的典型問題。給出轉錄組組裝新算法,計算精度和運算時間好於原有算法。...
本項目基於機器學習和組合最佳化算法等信息理論,研究RNA結構預測與進化分析。主要針對目前信息方法準確度低、大豆序列數據兼有EST和基因組特性這兩個問題,給出結合生物背景知識的字元串聚類算法,以提高敏感性和效率;建立適宜比較的RNA二級...
以動態規劃類型的並行計算問題為主要研究對象,在本項目預研期間提出的DAG數據驅動並行編程模型基礎上,本項目提出並實現了新的編程框架,在天河一號超級計算機環境中實現了運行時系統,基因序列分析等可抽象為動態規劃類型並行計算的套用問題...
《甲型流感病毒基因組信息分析及套用算法研究》是依託湖南大學,由蔡立軍擔任項目負責人的面上項目。中文摘要 基因序列的生物信息分析已成為病毒研究的重要手段,本項目將現代信息學方法和系統生物學方法套用於甲型流感病毒序列的比較、突變分析...
本項科學意義在於可擴展的滑動視窗捕獲到的保守或頻繁信息,是基於分塊算法的真正目標和精髓。③對大規模生物序列分析中的關鍵計算技術和方法,提出了動態規劃計算的儘快計算模式和並行計算中的負載平衡方法,並在多序列公共子序列、Smith-...
隨著蛋白質組學研究近年高速的發展,需要進行蛋白質結構的預測、功能的識別、以及生物標記物的預測與鑑別等,傳統的生物數據分析處理方法無法滿足後基因組時代的需要,因此發展能快速計算分析獲取蛋白質組信息的生物信息學方法成為關鍵性的基礎...
本課題主要研究大規模最佳化問題的並行算法及其在支持向量機等模型求解中的套用。首先研究無約束問題的高效並行變數分布和並行變數轉換等新算法,分析其全局收斂性質及並行效率;其次研究特殊約束問題的並行序列二次規劃和序列線性方程組算法,...