大數據系統運維

大數據系統運維

《大數據系統運維》是2018年4月清華大學出版社出版的圖書,作者是劉鵬、張燕、姜才康、陶建輝。

基本介紹

  • 書名:大數據系統運維
  • 作者:劉鵬、張燕、姜才康、陶建輝
  • ISBN:9787302493266
  • 定價:48元
  • 出版社:清華大學出版社
  • 出版時間:2018年4月
內容簡介,圖書目錄,

內容簡介

《大數據系統運維》是大數據套用人才培養系列教材中的一冊,講解了大數據系統運行維護過程中的各個主要階段及其任務,包括配置管理、系統管理、故障管理、性能管理、安全管理、高可用性管理、套用變更翻幾喇管理、升級管理及服務資源管理,內容全面且翔實,兼具基礎理論知識與運維實踐經驗,特別是重點介紹了大數據系統的運維特點及運維技能,以保障大數據烏組系統的穩定可靠運行,更好地支撐大數據的商業套用價值。
本書具有很強的系統性和實踐指導性,可以作為培養套用型人才的課程教采院遙晚材,也同樣適合於有意從事IT系統運維工作的廣大從業者和愛好者作為參考書。

圖書目錄

第1章 配置管理
1.1 配置管理內容 2
1.1.1 配置管理術語定殃拜汗頌義 2
1.1.2 套用軟體配置 3
1.1.3 硬體配置 4
1.2 配置管理方法 8
1.2.1 配置流程 9
1.2.2 配置自動發現 13
1.3 配置管理工具 14
1.3.1 CMDB資料庫介紹與實踐 14
1.3.2 自動配置工元盼協具 17
1.3.3 雲時代下的CMDB 29
1.4 其他運維工具 29
1.4.1 Ambari 29
1.4.2 CLI工具 32
1.4.3 Ganglia 33
1.4.4 Cloudera Manager 34
1.4.5 其他工具 38
1.5 作業與練習 39
參考文獻 39
第2章 系統管理及日常巡檢
2.1 系統建背燥邀設 40
2.1.1 技術方案 41
2.1.2 部署實施 43
2.1.3 測試驗收 47
2.2 系統管理對象 48
2.2.1 系統管理對象 48
2.2.2 系統軟體 49
2.2.3 系統硬體 61
2.2.4 系統數據 62
2.2.5 IT供應商 62
2.3 系統管理內容 63
2.3.1 事件管理 64
2.3.2 問題管理 64
2.3.3 配置管理 65
2.3.4 變更管理 66
2.3.5 發布管理 66
2.3.6 知識管理 67
2.3.7 日誌管理 67
2.3.8 備份管理 68
2.4 系統管理工具 68
2.4.1 資產管理 69
2.4.2 監控管理 69
2.4.3 流程管理 70
2.4.4 外包管理 71
2.5 系統管理制度規範 71
2.5.1 系統管理標準 71
2.5.2 系統管理制度 72
2.5.3 系統管理規範 72
2.6 日常巡檢 73
2.6.1 檢查內容分類 73
2.6.2 巡檢方法分類 74
2.6.3 巡檢流程 75
2.7 作業與練習 76
參考文獻 77
第3章 故障管理
3.1 集群結構 78
3.2 故障報告 80
3.2.1 發現 80
3.2.2 影響分析 81
3.3 故障處理 82
3.3.1 故障診斷 82
3.3.2 故障排除 83
3.4 故障後期管理 84
3.4.1 建立和更新知識庫 84
3.4.2 故障預防 85
3.5 作業與練習 86
參考文獻 86
第4章 性能管理
4.1 性能分析 87
4.1.1 性能因子 87
4.1.2 性能指標 88
4.2 性能監控工具 90
4.2.1 GUI 90
4.2.2 集群CLI 94
4.2.3 作業系統自帶工具 99
4.2.4 Ganglia 105
4.2.5 其他監控工具 107
4.3 性能最佳化 107
4.3.1 Hadoop集群配置規劃最佳化 107
4.3.2 Hadoop性能最佳化 108
4.3.3 作業最佳化 112
4.4 作業與練習 120
參考文獻 120
第5章 安全管理
5.1 安全概述 121
5.2 資產安全管理 122
5.2.1 環境設施安全 122
5.2.2 設備安全 123
5.3 套用安全 123
5.3.1 技術安全 123
5.3.2 數據安全 127
5.4 安全威脅 129
5.4.1 人為失誤 129
5.4.2 外部攻擊 131
5.4.3 信她祖設息泄密 132
5.4.4 災害 133
5.5 安全措施 133
5.5.1 安全制度規範 133
5.5.2 安全防範措施 134
5.6 作業與練習 135
參考文獻 136
第6章 高可用性管理
6.1 高可用性概述 137
6.2 高可用性技術 138
6.2.1 系統架構 138
6.2.2 容災 140
6.2.3 監控 140
6.2.4 故障轉移 148
6.3 業務連續性管理 149
6.3.1 災備系統 149
6.3.2 應急預案 153
6.3.3 日常演練 154
6.4 作業與練習 155
第7章 套用變更管理
7.1 變更管理概述 156
7.1.1 變更管理目標 156
7.1.2 變更管理範圍 156
7.1.3 變更管理的種類 157
7.1.4 變更管理的原則 157
7.2 變更管理流程 158
7.2.1 變更的組織架構 158
7.2.2 變更的管理策略 158
7.2.3 變更的流程控制 158
7.2.4 變更管理流程 158
7.3 變更配置管理 161
7.4 作業與練習 161
參考文獻 161
第8章 升級管理
8.1 Hadoop升級管理 162
8.1.1 Hadoop升級風險 163
8.1.2 HDFS的數據和元數據升級 163
8.1.3 YARN升級配置 164
8.2 Spark升級管理 164
8.2.1 Spark特性 165
8.2.2 Spark生態系統 166
8.3 Hive SQL升級管理 166
8.3.1 Hive SQL體系結構 167
8.3.2 安裝配置 167
8.4 ZooKeeper升級管理 169
8.4.1 單機模式 169
8.4.2 集群模式 170
8.5 作業與練習 171
參考文獻 172
第9章 服務資源管理
9.1 業務能力管理 173
9.1.1 業務需求評估 173
9.1.2 業務需求趨勢預測 174
9.2 服務能力管理 176
9.2.1 人員能力動態管理 176
9.2.2 服務成本動態管理 177
9.2.3 技術與工具管理 179
9.3 服務資源整合 179
9.3.1 不同角色的責權劃分 179
9.3.2 用戶、供應商、廠商的典型協作方式 181
9.4 作業與練習 183
參考文獻 184
附錄A 大數據和人工智慧實驗環境
附錄B Hadoop環境要求
附錄C 名詞解釋
3.2.1 發現 80
3.2.2 影響分析 81
3.3 故障處理 82
3.3.1 故障診斷 82
3.3.2 故障排除 83
3.4 故障後期管理 84
3.4.1 建立和更新知識庫 84
3.4.2 故障預防 85
3.5 作業與練習 86
參考文獻 86
第4章 性能管理
4.1 性能分析 87
4.1.1 性能因子 87
4.1.2 性能指標 88
4.2 性能監控工具 90
4.2.1 GUI 90
4.2.2 集群CLI 94
4.2.3 作業系統自帶工具 99
4.2.4 Ganglia 105
4.2.5 其他監控工具 107
4.3 性能最佳化 107
4.3.1 Hadoop集群配置規劃最佳化 107
4.3.2 Hadoop性能最佳化 108
4.3.3 作業最佳化 112
4.4 作業與練習 120
參考文獻 120
第5章 安全管理
5.1 安全概述 121
5.2 資產安全管理 122
5.2.1 環境設施安全 122
5.2.2 設備安全 123
5.3 套用安全 123
5.3.1 技術安全 123
5.3.2 數據安全 127
5.4 安全威脅 129
5.4.1 人為失誤 129
5.4.2 外部攻擊 131
5.4.3 信息泄密 132
5.4.4 災害 133
5.5 安全措施 133
5.5.1 安全制度規範 133
5.5.2 安全防範措施 134
5.6 作業與練習 135
參考文獻 136
第6章 高可用性管理
6.1 高可用性概述 137
6.2 高可用性技術 138
6.2.1 系統架構 138
6.2.2 容災 140
6.2.3 監控 140
6.2.4 故障轉移 148
6.3 業務連續性管理 149
6.3.1 災備系統 149
6.3.2 應急預案 153
6.3.3 日常演練 154
6.4 作業與練習 155
第7章 套用變更管理
7.1 變更管理概述 156
7.1.1 變更管理目標 156
7.1.2 變更管理範圍 156
7.1.3 變更管理的種類 157
7.1.4 變更管理的原則 157
7.2 變更管理流程 158
7.2.1 變更的組織架構 158
7.2.2 變更的管理策略 158
7.2.3 變更的流程控制 158
7.2.4 變更管理流程 158
7.3 變更配置管理 161
7.4 作業與練習 161
參考文獻 161
第8章 升級管理
8.1 Hadoop升級管理 162
8.1.1 Hadoop升級風險 163
8.1.2 HDFS的數據和元數據升級 163
8.1.3 YARN升級配置 164
8.2 Spark升級管理 164
8.2.1 Spark特性 165
8.2.2 Spark生態系統 166
8.3 Hive SQL升級管理 166
8.3.1 Hive SQL體系結構 167
8.3.2 安裝配置 167
8.4 ZooKeeper升級管理 169
8.4.1 單機模式 169
8.4.2 集群模式 170
8.5 作業與練習 171
參考文獻 172
第9章 服務資源管理
9.1 業務能力管理 173
9.1.1 業務需求評估 173
9.1.2 業務需求趨勢預測 174
9.2 服務能力管理 176
9.2.1 人員能力動態管理 176
9.2.2 服務成本動態管理 177
9.2.3 技術與工具管理 179
9.3 服務資源整合 179
9.3.1 不同角色的責權劃分 179
9.3.2 用戶、供應商、廠商的典型協作方式 181
9.4 作業與練習 183
參考文獻 184
附錄A 大數據和人工智慧實驗環境
附錄B Hadoop環境要求
附錄C 名詞解釋

相關詞條

熱門詞條

聯絡我們