《生物計算:生物序列的分析方法與套用》介紹生物計算中的幾種主要方法,如序列比對、系統發育分析、蛋白質序列的語義分析與結構預測、基因識別與生物晶片的數據分析等,給出它們的基本問題與有關的方法及套用。全書由三部分組成。第一部分介紹這些問題的由來與主要內容,給出它們的基本原理、計算與分析方法及套用意義,同時介紹一些國際上較為通用的軟體包。第二部分是生物學備忘錄,介紹有關生物學的基礎知識。第三部分是數學備忘錄,介紹與這些生物計算有關的數學理論與方法。《生物計算:生物序列的分析方法與套用》可作為數學、生物、醫學、化學等專業的本科生或研究生教材,其中第一部分內容可作為各專業的公共部分,而第二、三部分內容可供各專業適當選用。
基本介紹
- 書名:生物計算:生物序列的分析方法與套用
- 類型:科學與自然
- 出版日期:2010年3月1日
- 語種:簡體中文
- ISBN:9787030263933
- 作者:楊晶 胡剛
- 出版社:科學出版社
- 頁數:361頁
- 開本:16
- 品牌:科學出版社
內容簡介
圖書目錄
前言
第一部分 基本方法
第1章 生物序列突變與比對分析
1.1 生物序列突變與比對問題
1.1.1 生物序列的類型與結構
1.1.2 生物序列突變與比對問題的意義與套用
1.1.3 生物序列比對的原理與方法
1.2 二重序列比對的有關算法
1.2.1 關於動態規划算法的一些說明
1.2.2 動態規划算法
1.2.3 統計判決算法的基本思想
1.2.4 BLAST軟體的使用
1.3 多重序列的比對問題
1.3.1 MSA的意義與概況
1.3.2 MSA的定義與最佳化準則
1.4 MSA算法與計算
1.4.1 MSA算法的基本概念
1.4.2 MSA的算法步驟
1.4.3 ClustalW軟體的使用
1.4.4 關於MSA的幾點說明
1.4.5 幾個多重序列比對套用例子
1.5 SPA算法的原理與計算
1.5.1 SPA算法的基本原理
1.5.2 SPA算法的基本步驟
1.5.3 SPA算法源碼
1.5.4 SPA算法的有關問題討論
1.5.5 SPA算法的一個實例計算
習題與思考
第2章 系統發育分析
2.1 分子系統發育分析的基本概念
2.2 基於距離的方法
2.2.1 非加權分組平均法
2.2.2 鄰接法
2.3 基於特徵的方法
2.4 極大似然和Bayes方法
2.4.1 進化的機率論模型
2.4.2 構建進化樹的極大似然方法
2.4.3 構建進化樹的Bayes方法
2.5 構建進化樹軟體簡介
習題與思考
第3章 蛋白質一級結構的語義分析
3.1 蛋白質一級結構的信息與統計分析法
3.1.1 蛋白質一級結構的語義分析簡介
3.1.2 信息、統計分析法的要素與要點
3.1.3 局部詞的定義與判定
3.1.4 蛋白質一級結構的語義分析
3.2 蛋白質序列語義結構的組合分析法
3.2.1 關於組合圖論的有關記號
3.2.2 資料庫的複雜度
3.2.3 資料庫的關鍵字與核心詞
3.2.4 關於組合分析的若干套用問題
習題與思考
第4章 蛋白質結構預測
4.1 蛋白質二級結構預測
4.1.1 蛋白質二級結構預測的評價體系
4.1.2 Chou-Fasman方法
4.1.3 GOR方法
4.1.4 FHD方法
4.2 蛋白質空間結構預測
4.2.1 同源序列搜尋
4.2.2 摺疊識別方法
4.2.3 從頭預測方法
4.3 蛋白質結構預測軟體簡介
4.3.1 PHD軟體使用簡介
4.3.2 使用nnpredict.軟體預測蛋白質二級結構
4.3.3 PSIPRED軟體使用簡介
習題與思考
第5章 基因識別
5.1 緒論
5.1.1 原核基因識別
5.1.2 真核基因識別
5.1.3 常用模式基因組簡介
5.2 基因序列特徵分析
5.2.1 內含子與外顯子
5.2.2 CpG島
5.2.3 密碼子使用偏性
5.3 開放閱讀框識別
5.3.1 開放閱讀框特性
5.3.2 開放閱讀框識別原理
5.3.3 開放閱讀框識別軟體使用
5.4 Markov模型基因識別方法
5.4.1 隱Markov模型
5.4.2 GENSCAN隱Markov模型方法和原理
5.4.3 GENSCAN軟體使用
5.4.4 基因識別方法評價
5.5 其他基因識別方法簡介
5.5.1 神經網路方法
5.5.2 z曲線方法
習題與思考
第6章 基因表達數據分析
6.1 基因表達序列標籤數據分析簡介
6.1.1 基因表達序列標籤的概念
6.1.2 基因表達序列標籤數據的獲取
6.1.3 基因表達序列標籤數據聚類分析
6.1.4 基因表達序列標籤的套用
6.2 基因晶片數據的獲取
6.2.1 基本概念
6.2.2 基因晶片實驗過程
6.2.3 基因晶片數據獲取
6.2.4 基因晶片數據內容
6.3 基因晶片數據分析
6.3.1 基因表達譜晶片數據標準化
6.3.2 基因表達譜晶片數據散點圖分析
6.3.3 基因表達差異顯著性分析
6.4 基因晶片數據聚類分析
6.4.1 基本概念
6.4.2 特徵描述
6.4.3 分層聚類方法
6.4.4 模糊聚類方法
6.5 其他基因晶片數據分析方法簡介
6.5.1 支持向量機方法
6.5.2 K均值聚類
6.5.3 自組織映射圖聚類
6.6 基因晶片數據分析軟體簡介
習題與思考
第二部分 生物學備忘錄
第7章 核酸與DNA
7.1 細胞與染色體
7.1.1 細胞
7.1.2 染色體概念
7.1.3 染色體特徵
7.2 核酸分子與DNA結構
7.2.1 核酸分子
7.2.2 DNA分子結構
7.3 RNA結構與分類
7.3.1 RNA結構
7.3.2 RNA分類
第8章 胺基酸與蛋白質
8.1 胺基酸
8.1.1 胺基酸組成
8.1.2 胺基酸符號表示
8.1.3 胺基酸分類
8.2 肽鏈
……
第9章 基因與基因組
第10章 生物信息資料庫
第三部分 數學備忘錄
第11章 智慧型計算理論與算法
第12章 機率、信息與統計
第13章 隨機過程
參考文獻
索引
序言
自2004年以來,本人有幸多次參加南開大學數學科學學院沈世鎰教授主持的“生物信息學”討論班。在討論與學習過程中,不僅掌握了一些解決生物序列分析與計算的具體算法,更重要的是學到了解決生物序列分析的一些新方法和新思想。如生物序列的多種比對算法、數據結構中的語義分析及其在蛋白質結構分析中的套用等。這些方法從不同角度對生物計算中的有關問題進行研究與探討,並在許多方面得到了很好的套用。在學習過程中,與南開大學數學科學學院胡剛、王奎博士等合作,對生物計算中的算法以及相關軟體包的使用等問題有了更深入與確切的理解,使本書得以順利完成。我們希望能將該領域中的主要內容與方法介紹給讀者。
“生物計算”與“生物信息學”在本質上無大的區別,國內外的許多院校均把它們看作同一領域的學科。在本書中,我們把“生物計算”看作較偏重於原理與方法,同時注重它們的實現與套用,在介紹國外先進與常用算法的同時,增加了相應軟體包的使用與分析等內容。