可觀測性工程

《可觀測性工程》是2023年機械工業出版社出版的圖書。

基本介紹

  • 中文名:可觀測性工程
  • 出版時間:2023年7月1日
  • 出版社: 機械工業出版社
  • ISBN:9787111729099
內容簡介,圖書目錄,

內容簡介

本書基於作者在可觀測性領域的豐富實踐經驗撰寫而成,旨在幫助讀者在工程團隊內開展可觀測性實踐。書中深入分析了在軟體交付和運營的背景下可觀測性意味著什麼、如何構建基礎組件來實現可觀測性、可觀測性對團隊動力的影響、可觀測性規模化的考慮因素,以及在組織中建立可觀測性文化的實用方法,還通過豐富的實例展示了如何利用可觀測性改進現有的工作,並提供了從傳統工具(如度量工具、監控工具和日誌管理工具)遷移的實際注意事項。

圖書目錄

序1
前言3
第一部分 可觀測性的路徑
第1章 什麼是可觀測性11
1.1 可觀測性的數學定義11
1.2 把可觀測性套用到軟體系統12
1.3 關於軟體可觀測性的錯誤描述14
1.4 為什麼現在可觀測性很重要15
1.5 使用指標進行調試與使用可觀測性進行調試的對比18
1.6 使用可觀測性進行調試21
1.7 可觀測性適用於現代系統22
1.8 結論23
第2章 可觀測性和監控之間的調試實踐有何不同24
2.1 監控數據如何用於調試24
2.2 可觀測性如何實現更好的調試30
2.3 結論31
第3章 不通過可觀測性擴展系統的經驗教訓32
3.1 關於Parse的介紹32
3.2 Parse的擴展實踐33
3.3 向現代系統演進36
3.4 向現代化實踐變革38
3.5 在Parse的轉變實踐39
3.6 結論42
第4章 可觀測性與DevOps、SRE和雲原生的關聯43
4.1 雲原生、DevOps和SRE簡介43
4.2 可觀測性:調試方式的過去與現在45
4.3 可觀測性增強了DevOps和SRE的實踐45
4.4 結論47
第二部分 可觀測性基礎
第5章 結構化事件—可觀測性的構建塊51
5.1 通過結構化事件進行調試51
5.2 指標作為構建塊的局限性52
5.3 傳統日誌作為構建塊的局限性54
5.4 在調試中有用的事件屬性56
5.5 結論57
第6章 將事件拼接成鏈路58
6.1 分散式鏈路追蹤及其重要性58
6.2 鏈路追蹤的組件59
6.3 硬編碼探針構建鏈路追蹤61
6.4 將自定義欄位添加到鏈路span64
6.5 將事件拼接到鏈路中66
6.6 結論67
第7章 遵照OpenTelemetry的探針68
7.1 探針簡介68
7.2 開源探針標準69
7.3 使用基於代碼的示例的探針69
7.4 結論75
第8章 通過事件分析實現可觀測性77
8.1 從已有條件調試77
8.2 從第一性原理調試79
8.3 AIOps的誤導性承諾84
8.4 結論85
第9章 可觀測性和監控的融合86
9.1 監控適合的地方86
9.2 可觀測性適合的地方87
9.3 系統與軟體注意事項88
9.4 評估你的組織需求89
9.5 結論92
第三部分 團隊的可觀測性
第10章 在團隊中套用可觀測性實踐95
10.1 參與社區95
10.2 從最大的痛點著手96
10.3 購買代替自建97
10.4 反覆完善你的探針99
10.5 溫和改進,積極復用100
10.6 全力衝刺101
10.7 結論102
第11章 可觀測性驅動開發103
11.1 測試驅動開發103
11.2 軟體開發生命周期中的可觀測性104
11.3 從哪裡開始調試105
11.4 微服務時代的調試106
11.5 探針如何提高可觀測性107
11.6 可觀測性左移108
11.7 利用可觀測性加快軟體交付108
11.8 結論110
第12章 使用SLO來提高可靠性111
12.1 傳統監控方法造成危險的告警疲勞111
12.2 閾值告警只適用於“已知的未知”情況112
12.3 用戶體驗是一顆北極星114
12.4 什麼是SLO115
12.5 結論120
第13章 處理和調試基於SLO的告警121
13.1 在錯誤預算消耗完之前發出告警121
13.2 將時間定義成一個滑動視窗123
13.3 預見性地創建預測消耗告警124
13.4 使用SLO與時間序列數據的可觀測性數據134
13.5 結論136
第14章 可觀測性與軟體供應鏈137
14.1 為什麼Slack需要可觀測性139
14.2 探針:共享客戶端庫和維度140
14.3 案例研究:軟體供應鏈的運營143
14.4 結論148
第四部分 大規模可觀測性
第15章 自建與購買以及投資回報率151
15.1 如何分析可觀測性的投資回報率151
15.2 自建的真實成本152
15.3 購買軟體的真實成本156
15.4 購買與自建不是二元選擇159
15.5 結論160
第16章 高效的數據存儲161
16.1 可觀測性的功能要求161
16.2 案例研究:Honeycomb的列式數據存儲實現168
16.3 結論177
第17章 如何使採樣精準且便宜179
17.1 使用採樣策略來最佳化數據採集179
17.2 使用不同的採樣策略180
17.3 將採樣策略轉化為代碼183
17.4 結論193
第18章 使用流水線進行遙測管理195
18.1 遙測流水線的屬性196
18.2 管理一個遙測流水線:解剖200
18.3 管理遙測流水線時的挑戰202
18.4 用例:Slack的遙測管理204
18.5 開源替代方案207
18.6 管理遙測流水線:自建與購買208
18.7 結論208
第五部分 傳播可觀測性文化
第19章 可觀測性的商業案例211
19.1 被動引入變更的方法211
19.2 可觀測性的投資回報213
19.3 主動引入變更的方法214
19.4 將可觀測性引入實踐215
19.5 使用合適的工具216
19.6 知道何時你有足夠的可觀測性218
19.7 結論219
第20章 可觀測性利益相關方和聯盟   220
20.1 識別非工程可觀測性需求220
20.2 在實踐中創建可觀測性同盟222
20.3 使用可觀測性與商業智慧型工具225
20.4 在實踐中結合使用可觀測性和商業智慧型工具227
20.5 結論228
第21章 可觀測性成熟度模型229
21.1 關於成熟度模型的說明229
21.2 為什麼可觀測性需要成熟度模型230
21.3 關於可觀測性成熟度模型231
21.4 可觀測性成熟度模型中的能力參考232
21.5 在你的組織中使用可觀測性成熟度模型237
21.6 結論238
第22章 未來發展趨勢239
22.1 可觀測性的過去與現在239
22.2 其他資源241
22.3 可觀測性發展方向的預測242

相關詞條

熱門詞條

聯絡我們