實用生物信息學

實用生物信息學

《實用生物信息學》是2018年1月電子工業出版社出版的圖書,作者是馮世鵬。

基本介紹

  • 書名:實用生物信息學
  • 作者:馮世鵬
  • ISBN:9787121302244
  • 頁數:340頁
  • 定價:69元
  • 出版社:電子工業出版社
  • 出版時間:2018年1月
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

生物信息學是運用生物學、數學、計算機科學等多學科技術與手段進行生物信息的獲取、貯存、分析、利用的一門交叉學科,是目前生物學研究熱門領域之一。本書內容包括兩個篇章:一是Windows系統下進行文獻檢索、資料庫使用、引物設計、核酸蛋白質序列分析、進化分析、蛋白質結構分析、miRNA分析等理論與方法及相關軟體使用介紹;二是linux系統下面對於基因組測序、RNAseq、miRNAseq等二代測序數據組裝、基因預測、注釋、表達分析等操作流程及相關軟體介紹。

圖書目錄

目 錄
第0章 緒論 1
0.1 生物信息學的發展歷史 1
0.1.1 Bioinfomatics的來源 1
0.1.2 生物信息學的定義 1
0.1.3 人類基因組計畫 1
0.1.4 生物信息學發展重要人物及
大事 2
0.2 生物信息學的研究內容 4
0.2.1 生物分子數據的收集與管理 4
0.2.2 資料庫搜尋及序列比較 5
0.2.3 基因組序列分析 5
0.2.4 基因表達數據的分析與處理 5
0.2.5 蛋白質結構預測 6
0.2.6 非編碼RNA研究 6
0.2.7 表觀遺傳學研究 7
0.3 生物信息學的生物學基礎知識 7
0.3.1 遺傳定律 7
0.3.2 DNA分子結構 8
0.3.3 基因結構 8
0.3.4 中心法則 9
0.3.5 密碼子表 9
0.3.6 蛋白質結構與功能 9
0.3.7 PCR技術 9
參考文獻 10
Windows篇
第1章 文獻信息檢索 12
1.1 文獻資源的分類 12
1.1.1 根據出版形式進行分類 12
1.1.2 綜合分類法 13
1.1.3 標識碼及編號 14
1.2 文獻的格式 15
1.3 文獻檢索 17
1.3.1 文獻檢索詞的來源 17
1.3.2 搜尋資料庫選擇 18
1.3.3 檢索式構建 19
1.3.4 檢索結果的處理 21
1.3.5 CNKI資料庫查詢舉例 21
1.3.6 Elsevier資料庫檢索舉例 25
1.4 文獻信息的價值判斷及閱讀 27
1.4.1 文獻的價值判斷 27
1.4.2 文獻有效閱讀 29
1.5 科技查新 29
習題 31
參考文獻 31
第2章 生物信息數據資源 32
2.1 核酸序列資料庫 32
2.1.1 GenBank資料庫及其分類 33
2.1.2 Entrz Nucleotide資料庫及
其分類 34
2.1.3 NCBI其他資料庫 34
2.1.4 GenBank數據格式 35
2.1.5 GenBank數據訪問方式 35
2.1.6 基因資料庫記錄格式及搜尋 38
2.2 蛋白質序列資料庫 39
2.2.1 UniProt資料庫介紹 39
2.2.2 Uniprot數據獲得方式 41
2.2.3 UniProt資料庫記錄格式 42
2.3 蛋白質結構資料庫 43
2.3.1 PDB資料庫發展歷史 43
2.3.2 RCSB PDB資料庫介紹 44
2.3.3 RCSB PDB資料庫搜尋 45
2.3.4 RCSB PDB數據記錄 46
2.4 物種基因組資料庫 47
2.4.1 小鼠基因組資料庫 47
2.4.2 擬南芥基因組資料庫 49
2.5 代謝通路資料庫 52
2.5.1 在KEGG資料庫搜尋 53
2.5.2 主頁快速連結 54
2.5.3 KEGG通路圖及其元素意義 55
2.6 基因組瀏覽器 57
2.6.1 基因組數據展示內容 58
2.6.2 BLAT搜尋 61
2.7 非編碼RNA資料庫 62
2.7.1 miRNA資料庫 62
2.7.2 NONCODE資料庫 63
習題 66
參考文獻 66
第3章 序列比對 68
3.1 比對程式介紹 68
3.2 比對序列相似性的統計特性 69
3.3 線上BLAST序列比對 72
3.4 本地運行BLAST 75
3.4.1 BLAST程式的下載和安裝 75
3.4.2 搜尋資料庫的索引格式化 75
3.4.3 運行BLAST程式,搜尋本地
序列資料庫 76
3.5 多序列比對 77
3.5.1 ClustalX的使用 77
習題 80
參考文獻 80
第4章 核酸序列分析 81
4.1 基因閱讀框的識別 81
4.2 基因其他結構區預測 82
4.2.1 CpG島的預測 82
4.2.2 轉錄終止信號預測 84
4.2.3 啟動子區域的預測 84
4.2.4 密碼子偏好性計算 86
4.3 引物設計 88
4.3.1 引物設計的基本原則 88
4.3.2 Primer 5引物設計 88
4.3.3 利用Primer 5進行酶切位點
分析 91
4.4 核酸序列的其他轉換 92
習題 93
參考文獻 93
第5章 蛋白質序列分析 94
5.1 蛋白質理化性質和一級結構
分析 94
5.1.1 蛋白質理化性質分析 94
5.1.2 蛋白質理化性質分布圖 95
5.1.3 蛋白質信號肽預測 97
5.2 蛋白質二級結構分析 99
5.2.1 蛋白質跨膜結構區分析 99
5.2.2 蛋白質捲曲螺旋分析 101
5.2.3 蛋白質二級結構預測分析 103
5.3 蛋白質三維結構預測分析 104
習題 105
參考文獻 105
第6章 基因表達分析 106
6.1 qPCR數據分析 106
6.1.1 絕對定量分析方法 107
6.1.2 相對定量方法分析 108
6.2 基因晶片數據分析 111
6.2.1 從GEO上下載基因晶片表達
譜數據 111
6.2.2 將表達譜數據導入MATLAB
軟體 112
6.2.3 對soft格式檔案的標準化 113
6.2.4 差異表達基因篩選 114
習題 114
參考文獻 115
第7章 進化分析 116
7.1 進化理論介紹 116
7.1.1 種群是生物進化的基本單位 116
7.1.2 可遺傳的變異是生物進化的
原始材料 116
7.1.3 分子進化中性學說 117
7.2 進化分析(以MEGA為例) 117
7.2.1 序列準備 118
7.2.2 序列比對 119
7.2.3 建樹計算 119
7.2.4 進化樹的調整 121
習題 121
參考文獻 122
第8章 非編碼miRNA分析 123
8.1 miRNA簡介 123
8.1.1 miRNA的生物合成 123
8.1.2 miRNA調控基因表達的機理 124
8.1.3 miRNA的生理調節作用 125
8.2 miRNA靶基因預測 125
8.2.1 miRNA靶基因的預測原理 125
8.2.2 miRNA靶基因的預測軟體 126
8.2.3 miRNA靶基因的預測步驟 127
8.3 調控靶基因的miRNA預測 130
8.4 miRBase資料庫的使用 131
8.4.1 miRBase資料庫的搜尋 131
8.4.2 miRBase資料庫批量下載 132
8.4.3 miRNA記錄信息 133
習題 134
參考文獻 134
Linux篇
第9章 Linux系統 138
9.1 Linux簡介 138
9.1.1 什麼是Linux系統 138
9.1.2 為什麼要學習Linux系統 139
9.1.3 如何學習Linux系統 140
9.2 Linux系統安裝 140
9.2.1 Linux系統下載 140
9.2.2 系統安裝盤製作 142
9.2.3 CentOS 6.5作業系統安裝 144
9.2.4 更新yum源 154
9.3 Linux命令行模式——終端 155
9.4 Linux系統開關機 156
9.5 Linux系統檔案 157
9.5.1 Linux資料夾及其主要作用
(以CentOS 6.5為例) 157
9.5.2 Linux的檔案信息的意義 158
9.5.3 Linux命令幫助檔案 159
9.6 幾個重要的快捷鍵 161
9.7 Linux系統的命令 161
9.7.1 Linux系統命令的輸入格式 161
9.7.2 常用命令及其常用選項介紹 161
9.7.3 數據流重定向 167
9.7.4 管道命令 168
9.7.5 vim編輯器工具 168
9.7.6 其他命令 170
習題 177
參考文獻 177
第10章 Perl語言 178
10.1 Perl版本 178
10.2 Perl標量數據 179
10.2.1 Perl運算符 180
10.2.2 標量變數 180
10.2.3 數字及字元串的比較
運算符 181
10.3 列表與數組 182
10.3.1 數組及其賦值操作 182
10.3.2 數組元素的引用 182
10.3.3 數組相關的幾個命令 183
10.4 哈希 183
10.4.1 哈希賦值 184
10.4.2 哈希的相關函式 184
10.5 判斷式及循環控制結構 185
10.5.1 if條件判斷式 185
10.5.2 while循環結構 185
10.5.3 until循環結構 186
10.5.4 foreach循環結構 186
10.5.5 each控制結構 186
10.6 正則表達式 187
10.6.1 正則表達式相關符號 187
10.6.2 捕獲變數 188
10.6.3 正則表達式中特殊字元
的意義 188
10.7 Perl的排序 189
10.7.1 sort命令 189
10.7.2 sort與比較運算符及默認
函式的連用 189
10.8 Perl默認的函式的總結 189
10.9 程式精解 190
10.9.1 實例一:從fasta檔案中
尋找特定的序列 190
10.9.2 實例二:文本內容分類
統計功能 193
10.9.3 實例三:統計檔案內容
是否有重複 195
10.9.4 實例四:Scaffolds序列
的排序 196
習題 196
參考文獻 197
第11章 測序方法及數據處理 198
11.1 測序技術的發展 198
11.1.1 第一代測序方法 198
11.1.2 二代測序方法 201
11.1.3 測序文庫插入片段大小
選擇 205
11.1.4 測序類型 205
11.1.5 測序方法的搭配 206
11.1.6 測序質量值 206
11.2 測序數據處理 207
11.3 測序數據質量分析 208
11.3.1 用FastQC軟體對測序數據
進行評估 208
11.3.2 NGSQCToolKit對測序
Reads的處理 213
11.3.3 FASTX_Toolkit對測序
14.1 轉錄組序列比對 265
14.1.1 數據準備 265
14.1.2 比對資料庫 265
14.1.3 TopHat軟體下載及安裝 266
14.1.4 Bowtie軟體和SAMtools
軟體下載及安裝 266
14.1.5 常用TopHat參數介紹 266
14.1.6 基因組資料庫序列索引 267
14.1.7 TopHat使用實例 267
14.1.8 輸出檔案說明 267
14.2 轉錄本組的組裝 268
14.2.1 cufflinks的安裝 268
14.2.2 cufflinks的參數 269
14.2.3 cufflinks的輸出結果 269
14.3 合併轉錄組 269
14.3.1 用cuffmerge合併轉錄本
的命令 270
14.4 基因表達差異分析 270
14.4.1 用cuffquant計算表達譜 270
14.4.2 用cuffdiff計算不同樣本
表達譜的差異 271
14.5 差異表達結果的熱圖表示 272
習題 273
參考文獻 273
第15章 基因預測 275
15.1 GeneMark軟體序列 275
15.1.1 GeneMarkS的安裝 275
15.1.2 相關參數介紹 276
15.1.3 GeneMarkS命令運行 279
15.1.4 GeneMarkS運行結果解釋 280
15.2 Glimmer軟體 280
15.2.1 Glimmer軟體安裝 280
15.2.2 相關命令參數介紹 281
15.2.3 程式運行 284
15.2.4 結果解讀 286
15.3 AUGUSTUS 286
15.3.1 AUGUSTUS軟體安裝 286
15.3.2 相關參數介紹 286
15.3.3 訓練AUGUSTUS 287
15.4 PASA 291
15.4.1 PASA軟體安裝 291
15.4.2 相關命令參數介紹 293
15.4.3 命令運行 294
15.4.4 運行結果解讀 296
15.5 EVM(EVidenceModeler) 296
15.5.1 EVM軟體下載安裝 296
15.5.2 相關參數介紹 297
15.5.3 EVM軟體的運行 298
習題 300
參考文獻 300
第16章 基因注釋及功能分析 302
16.1 BLAST軟體介紹 302
16.1.1 BLAST軟體安裝 302
16.1.2 相關命令參數介紹 303
16.2 NR注釋 308
16.2.1 NR資料庫製備過程 308
16.2.2 NR注釋過程 309
16.3 COG注釋 310
16.3.1 COG資料庫準備過程 310
16.3.2 COG命令注釋過程 311
16.4 Swiss-Prot注釋 311
16.4.1 資料庫準備 312
16.4.2 Swiss-Prot注釋過程 312
16.4.3 InterPro注釋 312
16.5 KEGG注釋 314
16.6 GO注釋 317
習題 320
參考文獻 321
附錄A 生物信息學檔案格式 322

相關詞條

熱門詞條

聯絡我們