SRE生存指南：系統中斷回響與正常運行時間最大化

內容簡介

站點可靠性工程（Site Reliability Engineering，簡稱SRE）是一個令人興奮的新興領域，它專注於如何確保系統穩定、可靠地運行。本書基於一個金字塔層次結構模型，深入淺出地介紹了關於SRE 的方方面面，涉及膠遷趨監控、事故回響與回顧、測試與發布、容量拒禁講規劃、開發、用戶體驗設計，以及貫穿其中的溝通技巧。本書是SRE 工程師、DevOps 工程師、運維工程師和系統管理員不可或缺的參考資料；軟體架構師、軟體工程師、用戶體驗設計師也能從本書中獲取關於SRE 的相關知識。

SRE生存指南：系統中斷回響與正常運行時間最大化

基本介紹

內容簡介

目錄

相關詞條

熱門詞條