《生物序列分析》是2010年科學出版社出版的圖書,作者是Richard Durbin。
基本介紹
內容簡介,作者簡介,目錄,前言,
內容簡介
《生物序列分析》在結構上大致可以分為四個部分,每個部分所覆蓋的問題分別是:二序列聯配、多序列聯配、系統發育樹和RNA結構,具體分為:二序列聯配、Markov鏈與隱馬模型、使用HMM的二序列聯配、朋於序列家族的列型HMM、多序列聯配方法、構造系統發育樹和系統發育的機率論方法,《生物序列分析》介紹的列型MM、多序列聯配方法、構造系統發育樹和系統發育的機率論方法,《生物序列分析》介紹的一些方法將不同的生物信息來源整合到一般的、清晰且可操作的序列分析機率論模型中,有助於研究者深入了解生物序列分析的基礎。
《生物序列分析》可供牛物信息學、分子生物學、數學、計算機科學以及物理學專業的研究生或高年級本科生及這些領域的老帥和研究人員參考。
作者簡介
Richard Durbin,1987年獲得博士學位,研究方向為蠕蟲神經系統的發育與組織。英國Sanger中心生物信息部負責人,先後參與線蟲基因組和人類基因組項目、WormBase線蟲模式生物資料庫ACEDB基因組資料庫、Pfam蛋白質結構域資料庫以及Ensembl脊椎動物基因組注釋。與SeanEddy、Anders Krogh以及Graeme Mitchison一起撰寫了Biological Sequence Anaivsis一書,並於1998年由劍橋大學出版社出版。
Sean Eddy,Janelia Farms的17個研究小組負責人之一,部分隸屬於霍華德·休斯醫學研究會,當前致力於計算基因組序列分析,使用機率論建模技術開發新算找DNA、RNA和蛋白質序列的特徵。他的主要興趣一個是識別新的結構和催化RNA,另一個是識別遠緣的蛋白質同源序列。
Anders Krogh,哥本哈根大學生物信息中心負責人、生物信息學教授,因David Haussler——起率先在生物信息學領域使用隱馬模型而聞名。作為Biological Sequence Analvisis一書的作者之一。他同時也是另一本更早一些的神經網路教科書的作者之一。他當前的研究興趣包括啟動子分析、非編碼RNA,基因預測以及蛋白質結構預測。
Graeme Mitchison,劍橋大學分子生物學實驗室教員,量子計算研究者和計算生物學家,從事序貫弱度量、deFinetti定理量子等研究。
·查看全部>>
目錄
譯者名單
中文版序一
中文版序二
譯者的話
前言
第1章 緒論
1.1 序列的相似性、同源性及聯配
1.2 本書概述
1.3 機率與機率論模型
1.4 補充讀物
第2章 二序列聯配
2.1 引言
2.2 計分模型
2.3 聯配算法
2.4 更複雜模型的動態規劃
2.5 啟發式聯配算法
2.6 線性空間聯配
2.7 分值的顯著性
2.8 從聯配數據推導計分參數
2.9 補充讀物
第3章 Markov鏈與隱馬模型(HMM)
3.1 Markov鏈
3.2 隱馬模型
3.3 HMM的參數估計
3.4 HMM的模型結構
3.5 更複雜的Markov鏈
3.6 HMM算法的數值穩定性
3.7 補充讀物
第4章 採用HMM的二序列聯配
4.1 索引
4.2 x和y的對所有路徑求和的全機率
4.3 次優聯配
4.4 x聯配上yi的後驗機率
4.5 用於搜尋的成對HMM與FSA之對比
4.6 補充讀物
第5章 用於序列家族的列型HMM
5.1 無空位計分矩陣
5.2 添加插入與刪除狀態以獲得列型HMM
5.3 從多序列聯配中導出列型HMM
5.4 基於列型HMM的搜尋
5.5 用於非全局聯配的列型HMM變體
5.6 對機率估計的深入說明
5.7 最優模型的構建
5.8 訓練序列的加權
5.9 補充讀物
事6章 多序列聯配方法
6.1 多序列聯配的含義
6.2 為多序列聯配計分
6.3 多維動態規劃
6.4 漸進聯配方法
6.5 由列型HMM訓練的多序列聯配
6.6 補充讀物
第7章 構造系統發育樹
7.1 生命之樹
7.2 樹的背景知識
7.3 用成對距離建樹
7.4 簡約法
7.5 樹的評估:自舉法
7.6 聯配與系統發育的同時處理
7.7 補充讀物
7.8 附錄:鄰接法定理的證明
第8章 系統發育的機率論方法
8.1 引言
8.2 進化的機率論模型
8.3 計算無空位聯配的似然
8.4 用似然做推斷
8.5 更現實的進化模型
8.6 機率論方法與非機率論方法的比較
8.7 補充讀物
第9章 轉換文法
9.1 轉換文法
9.2 正則文法
9.3 上下文無關文法
9.4 上下文有關文法
9.5 隨機文法
9.6 用於序列建模的隨機上下文無關文法
9.7 補充讀物
第10章 RNA結構分析
10.1 RNA
10.2 RNA二級結構預測
10.3 協方差模型:基於SCFG的RNA列型
10.4 補充讀物
第11章 機率論背景
11.1 機率分布
11.2 熵
11.3 推斷
11.4 抽樣
11.5 從計數估計機率
11.6 EM算法
參考文獻
部分術語漢英對照
部分術語英漢對照
索引
·收起全部<<
前言
1992年在Snowbird舉行的一次神經網路會議上,Darid Haussler及其加州大學聖克魯斯分校(UCSC)的同事們(其中也包括本書作者之一Anders Krogh)描述了使用機率論模型對蛋白質序列進行多序列聯配建模的初步結果,他們稱這種模型為隱馬模型(HMM)。隨後他們的技術報告複本被廣泛地傳播,其中一些流傳到劍橋大學的MR(分子生物學實驗室。在那裡,Richard Durbin和Graeme Mitchison剛剛將自己的研究興趣從神經建模轉移到計算基因組序列分析上來,Sean Eddy當時是該實驗室的一名博士後,其研究背景是實驗分子遺傳學,他對計算分析非常感興趣。不久以後Anders Krogkt也到劍橋大學工作了一年。
我們都快速地接受了機率論建模的思想,並且相信HMM及其隨機文法對應物是優美的數學對象,十分適合獲取埋藏在生物序列中的信息。聖克魯斯小組和劍橋小組很快獨立地開發了各自免費的HMM序列分析軟體包,並且各自獨立地將HMM方法推廣到用於RNA二級結構分析的隨機上下文無關文法上。與此同時,在加州理工學院噴氣推進實驗室(JPL/caltech),由Pierre Baldi領導的另一個研究小組也受Snowbird會議成果的啟發,進行著基於HMM方法的研究。