《海量運維、運營規劃之道》是2014年1月出版的圖書,作者是唐文。
基本介紹
- 書名:海量運維、運營規劃之道
- 作者:唐文
- ISBN: 978-7-121-21796-8
- 頁數:216
- 定價:59.00元
- 出版時間:2014年1月
- 開本:16
內容簡介,編輯推薦,目錄,作者簡介,媒體評論,前言,
內容簡介
《海量運維、運營規劃之道》作者具有騰訊、百度等中國一線網際網路公司多年從業經歷,書中依託工作實踐,以網際網路海量產品質量、效率、成本為核心,從規劃、速度、監控、告警、安全、管理、流程、預案、考核、設備、頻寬等方面,結合大量案例與讀者分享了作者對網際網路海量運維、運營規劃的體會。
《海量運維、運營規劃之道》全面介紹大型網際網路公司運維工作所涉及的各個方面,是每個網際網路運維工程師、架構師、管理人員不可或缺的寶貴參考書。
編輯推薦
騰訊、百度一線資深工程師乾貨分享。
騰訊、百度、阿里、高德、基調等多位總監、技術經理聯名力薦。
學習中國一線網際網路企業如何在大數據時代實現全局負載均衡、容災、柔性等特性,尋求成本、效率、質量三者之間的平衡。
目錄
第1部分 質量
第1章 規劃 /2
1.1 架構規劃 /2
1.1.1 新趨勢、新機遇、新挑戰 /2
1.1.2 產品、架構、成本的生命周期 /3
1.1.3 質量、速度、成本 /5
1.1.4 專業化、平台化、持續化 /7
1.1.5 可伸縮、可調度、可擴展 /8
1.1.6 Set模型,貨櫃改變世界 /10
1.1.7 全網調度,速度與容災並進 /12
1.1.8 海量導致架構取向,適用是王道 /15
1.1.9 大系統簡單做、小做 /17
1.2 IDC規劃 /19
1.2.1 全球最複雜的基礎網路 /19
1.2.2 IDC屬性、瓶頸分析及建議 /21
1.2.3 IDC策略,分布制勝、速度第一 /24
1.3 CDN規劃 /27
1.3.1 CDN發展現狀與趨勢分析 /27
1.3.2 CDN廠商分析及外包細節 /28
1.3.3 CDN節點分布及解析策略 /32
1.3.4 CDN外包質量和風險控制 /34
1.4 預算規劃 /37
1.4.1 預算的作用及預算推導 /37
1.4.2 伺服器定製,切合套用與性價比 /39
1.4.3 伺服器需求,用數據說話 /42
第2章 速度 /45
2.1 網站速度最佳化介紹 /45
2.1.1 什麼是網站速度最佳化 /45
2.1.2 網站速度最佳化的價值 /46
2.1.3 網站速度關鍵指標 /47
2.1.4 影響網站速度的因素 /50
2.2 網站速度監測實踐 /51
2.2.1 網站速度監測概述 /51
2.2.2 網站速度主動監測 /53
2.2.3 網站速度被動監測 /54
2.3 網站速度分析實踐 /57
2.3.1 網站速度分析概述 /57
2.3.2 網站速度分析工具 /62
2.3.3 網站速度分析案例 /67
2.4 網站速度最佳化實踐 /72
2.4.1 網站速度最佳化概述 /72
2.4.2 網路速度最佳化及案例 /73
2.4.3 系統速度最佳化及案例 /80
2.4.4 前端速度最佳化及案例 /83
2.5 防止網站速度退化 /88
2.5.1 通過規範防止速度退化 /88
2.5.2 通過工具防止速度退化 /90
第3章 監控 /94
3.1 監控概述 /94
3.1.1 監控定義和價值 /94
3.1.2 監控體系和實現途徑 /95
3.2 用戶監控實踐 /97
3.2.1 訪問監控,獲取用戶訪問速度 /97
3.2.2 URL監控,服務實時訪問狀態 /103
3.2.3 劫持監控,了解全國劫持狀態 /105
3.2.4 內容監控,掌握網頁元素變化 /108
3.3 機器監控實踐 /109
3.4 網路監控實踐 /113
3.4.1 網路監控,時刻掌控廣域網變化 /113
3.4.2 回響監控,IDC內服務回響監控 /118
3.4.3 域名監控,做精準的DNS解析 /119
3.5 套用監控實踐 /124
3.5.1 模組監控,動態套用模組監控 /124
3.5.2 資料庫監控,資料庫運行可視化 /126
第4章 告警 /129
4.1 告警概述 /129
4.1.1 告警定義和途徑 /129
4.1.2 告警問題和規避方法 /130
4.2 告警模型 /131
4.2.1 告警分類,將告警分類區分對待 /131
4.2.2 告警模型,如何建立告警模型 /133
4.3 告警最佳化 /134
4.3.1 告警收斂,規避被告警淹沒 /134
4.3.2 告警關聯,讓告警更具價值 /135
4.3.3 告警分析,用數據說話 /135
第5章 安全 /138
5.1 Web漏洞掃描 /138
5.2 域名劫持掃描 /140
5.3 DDoS攻擊掃描 /142
5.4 敏感信息掃描 /144
5.5 網頁篡改掃描 /146
第2部分 效率
第6章 管理 /150
6.1 配置管理,標識所有的資源並記錄在冊 /150
6.2 事件管理,記錄、分類、診斷、解決問題 /152
6.3 問題管理,消除引起問題的根本原因 /154
6.4 變更管理,串聯變更原因、過程、結果 /157
6.5 容量管理,對運營指標未來的量化、預測 /159
第7章 流程 /163
7.1 業務運維管理規範 /163
7.2 系統用戶管理規範 /165
7.3 設備使用管理規範 /168
7.4 套用安全管理規範 /169
7.5 開發與編譯環境安全規範 /171
7.6 故障分級和處罰規範 /172
第8章 預案 /175
8.1 預案,從容有序應對危機 /175
8.2 預演,提高故障執行力 /177
第9章 考核 /179
9.1 運維能力考核 /179
9.2 架構能力考核 /180
9.3 運營預算考核 /182
第3部分 成本
第10章 基礎 /184
10.1 規模化導致運營成本凸顯 /184
10.2 運營成本最佳化方向和策略 /185
10.3 工具協助成本可持續最佳化 /187
第11章 設備 /190
11.1 伺服器分類、分級、分層定製 /190
11.2 業務分類平台化減少運營成本 /192
11.3 混布最大限度提高資源利用率 /192
第12章 頻寬 /194
12.1 通過改變產品形態減少數百萬成本 /194
12.2 通過降低頻寬單價減少成本 /197
12.3 通過自動最佳化減少頻寬成本 /199
作者簡介
唐文,先後在騰訊、盛大、百度工作,曾負責騰訊四大平台之一網路媒體整體運維、運營,對海量網際網路產品運維支撐、運營規劃、性能最佳化、成本最佳化、平台研發、質量效率等有豐富的實踐,就職於百度,T7架構師,負責百度產品線訪問速度最佳化改進工作,百度速度監測平台(UAQ)、百度移動雲套用性能監測平台(APM)負責人,百度學院講師。
媒體評論
過去十多年,中國網際網路見證了騰訊、百度等巨人的崛起,這些公司把握機會,迅速成長,在規模、效益、技術方面能與Google、Facebook、Amazon等國際巨頭媲美。這些中國網際網路巨頭的崛起,很大程度上是由於他們有一批非常聰明、勤奮、進取的優秀員工。這些員工結合中國網際網路的實際情況,不斷摸索,探索出最適合中國國情的技術、產品、經營經驗。這些寶貴的經驗值得每一個中國網際網路從業人員學習、借鑑。
本書作者唐文正是這些中國網際網路巨頭公司優秀員工中的一位。他在騰訊、百度從事了多年數據中心及後台服務運維,見證了業務量成百倍的增長,運維的系統支撐了每天上億甚至數十億計的用戶請求。他把多年的運維經驗總結出來,與大家分享,也算是對中國網際網路業的一份貢獻。
本書總結了運維規劃、運維質量、網站加速、網站監控、數據中心建設等方面的大量實戰經驗和心得體會,這些經驗是每個網際網路運維工程師、架構師、管理人員都必須掌握的。
衷心希望每位讀者,無論是新手還是老將,都能從本書受益。
——高德軟體技術副總裁 陳軍
書中把當今中國一線網際網路公司的運維工作,成體系地搬到了大家面前,讓大家看到中國一線網際網路公司是如何做技術運維工作、如何做產品速度體驗最佳化的,以及做這些工作的方法論。
同時,這也是一本適合網際網路業務的架構師,或者想成為網際網路業務架構師的技術人員閱讀的書。書中介紹的很多案例,都是從技術架構上做的。讓我們看到中國一線網際網路企業是如何實現全局負載均衡的,如何實現容災、柔性等特性,以及如何實現成本、效率、質量三者之間的平衡。我相信這些豐富的案例,以及方法論,應該給你足夠的啟發,讓你能夠想到自己的業務架構如何做是最合適的、最合理的。
——騰訊網路媒體事業群 運維總監 王魯強
雲計算、大數據和移動互聯,正在驅動著我們的生活產生巨大改變,這改變背後的核心動力之一,是一套規模化、安全、穩定、高效的運維體系和具備駕馭能力的運維人員。一名出色的運維人員,是學習型,複合型和實用型人才。越來越多的朋友有志或已經成為運維大家庭一員,而市面上,幫助大家系統的學習和分享大型網站運維的書籍少之又少,是個有待挖掘的領域。唐文有多年大型網站運維實戰經驗,其匯聚多年積累撰寫的《海量運維、運營規劃之道》正是一個可貴的嘗試和思考,給廣大運維從業人員提供了一個途徑:既從真實場景出發,解決實際運維問題;又能提煉歸納,成為構建大型網站的指引方法。相信大家結合本書內容和自己面對的套用場景,學以致用,舉一反三,能夠受益良多。
——阿里技術保障總監 張穎傑
當我看到本書的初稿時,頓時有一種相見恨晚的感覺。自己從事運維管理、運營系統建設工作已經7年,期間閱讀過不少好文,自己也寫過一些對局部領域的總結文字,但是如此全方位、多角度、具備實戰價值的“運維寶典”,還是第一次遇見,實在是愛不釋手。衷心希望kevin兄弟的大作,能為戰鬥在運維崗位上的小夥伴們理清工作思路,找準發展方向,登上新的台階。
—— 騰訊技術工程事業群 運維總監 肖志立
在百度, RD,OP&QA經常掛在嘴上的一句話就是“永遠要對線上保持敬畏之心”, 在大數據時代, critical infrastructure的體量都在十幾和幾十萬伺服器的級別,網際網路上突發流量場景(如雙11)也不斷出現,這些都對線上集群的運維提出了很多新的挑戰,這本書能為你找到很多的答案。
——百度測試部 總監 高亮
喜歡讀唐文的書,因為他的文章能夠給網際網路從業者以真正的啟發、指導和引領。啟發如何從運營角度構建網際網路架構,指導如何解決大數據時代海量數據運營問題,引領如何成為架構師和COO。文如其人,簡單而厚重。
——百度運維部 技術經理 沈慧勇
這是我看過的最實用的海量服務ITIL平台建設工具,沒有之一!對於快速發展的中大型網際網路公司,關注系統的效率、服務質量以及投入成本是永恆的話題。這本書用非常實戰的案例、大量的統計數據和體系化的實施方案告訴讀者如何解決公司最關注的問題。
—— 1號店IT部 資深總監 胡茂華
這本書絕對讓我及其他讀者受益。我想區別於其他此類書籍的是此書中素材是唐文過去近十年實際工作經驗精華的總結,而他的經歷與中國網際網路飛速發展正好同步,海量運維的發展他一直置身其中。所以此書對合適讀者借鑑意義就更有現實意義,相信讀了此書的朋友一定會有我同樣的感受。
——攜程旅行網高級總監 酒店事業部產品技術負責人 蔡新發
網際網路運維是一個涉及知識面比較廣的工作崗位,所有的工作也是圍繞著服務質量、速度和成本進行展開 ,同時還需要考慮服務的可運維性(可擴展、可監控、可容災、可調度等)和安全性。本書全面的介紹了大型網際網路公司運維工作所涉及的各個方面,你甚至可以從中了解到運維流程、服務考核、標準相關的內容。10年與唐文結識,他在CDN和訪問質量方面有非常豐富的經驗,在百度負責用戶訪問質量topic,本書自然也在訪問質量監測、最佳化方面有較詳細的描述。
—— 小米 運維總監 井源
當我翻看本書的時候,一種久違的溫馨和激動油然而生,他正是以切身的經歷闡述了運維的方向,我有著深切的共鳴,端琢之下,書中還不乏真實的案例乃至數據,這些資料在圈內都是極為珍貴的,這也是本書的一大特色。據上,我誠摯地推薦:本書既適合業界人士的科普,也適合對運維有一定經驗後系統的整理思路,尤其對提升網站的用戶訪問速度的有指導作用。相信:它和他一定能幫助大家規避彎路,直踏康莊大道。
——宜搜科技 研發總監 劉捷
如今的網際網路運維,運營,規劃及最佳化愈發依賴用戶體驗量化和客觀業務發展,因此與時俱進的運維思想及規劃理論非常重要。《海量運維、運營規劃之道》將複雜的思想和理論深入淺出,配合真實的案例更具說服力。作為一線的網際網路用戶體驗管理體系的推廣者,我極力推薦業內同事閱讀此書!
——基調網路 技術支持副總裁 褚冬毅
每一位運維人內心對運維都有自己獨特的理解。筆者從自己多年經驗出發,為讀者展現一個運維的高層視圖。給這個容易被誤解的行業一個整體的介紹。新手可以獲得整體知識脈絡,老手亦可充實自己的知識庫。尤其是成本和速度最佳化部分濃縮筆者多年一線經驗,值得一讀。
——百度運維部 架構師 劉卓
前言
為什麼要寫這本書
我在騰訊、百度工作多年,參與過多個海量產品的研發和維護,也見證這些產品從無到有,從小到大,並且歷經數年持續疊代和穩定運行的整個生命周期。在整個生命周期中都離不開產品、研發、測試、運維等角色的全程參與和配合。而運維在上線前架構、系統、網路、硬體資源規劃及上線後質量、效率、成本管理方面都發揮了不可替代的作用。優秀的架構師、團隊管理者、研發工程師、測試工程師等角色都需要了解這些才能進一步做好網際網路產品,本書的初衷是把運維這個角色的價值和作用介紹給所有網際網路從業人員,特別是入行不久的運維朋友。
書中的內容是從2010年4月陸續記錄在個人blog上的,根據Google Analytics統計,至今瀏覽量有14萬,訪問次數為4.9萬次,唯一身份訪問者有2.4萬人,很多熱心的朋友單獨聯繫我,給我很多支持和鼓勵,這些也是我決定寫這本書的動力。近3年整理的內容將作為第一版先行出版,第二版已經在梳理,時機成熟會再次出版。
本書的名字叫《海量運維、運營規劃之道》,海量運維是指支撐大規模產品的架構、網路、系統、套用的維護,運營規劃是指產品運行的質量、效率、成本的管理,道在這裡的意思是方向、方法,所以本書是表達如何做好大規模網際網路產品維護管理的方法論。關於海量運維、運營規劃,我想業界都沒有準確的定義,假如說網際網路的架構師用能否設計多高的摩天大樓來衡量架構能力,那么運維、運營更多的是在關注網際網路服務的穩定、質量、效率、成本、故障、瓶頸及用戶的忍耐、抱怨等問題。在本書中,將以質量、效率、成本為核心,從運營規劃、管理、流程/規範、系統/平台、監控、告警、安全、最佳化、考核等幾個維度結合案例來與大家分享自己的體會,內容大致如下。
痛並快樂著!
從未有過這樣的充實,沒有停留,離開深圳,來到上海,跟之前一樣的感覺,長沙-北京,北京-深圳,深圳-上海,9年工作生涯,隨風飄過。
可能,人生,在經歷著無數的痛苦和快樂後,慢慢的老去,有希望達成的,也有變夢想的,結局都歸屬黃土。
關於網際網路運維、運營
關於網際網路運維、運營,相信大家對運維比較熟悉,但對於運營,可能會有歧義。運維、運營這兩個名詞在騰訊會特別被強調和區分。說說我對這個崗位的理解,首先看看騰訊(百度類似)有哪些崗位及分類。
綜上所述,這裡對運維、運營的理解又綜合、抽象了技術支持類工程師的屬性,比如套用運維、運營服務管理、系統管理等,甚至是研發工程師,可以理解為一種綜合素養和協調能力。具體的工作大致如下:
讀者對象
本書適合以下讀者閱讀:
● 網際網路行業運維工程師、測試工程師、前端研發工程師、後端研發工程師
● 網際網路行業技術經理、項目經理、產品經理、CTO
● 致力於從全局把握運維和最佳化網站及網際網路產品的所有網際網路從業人員
勘誤和支持
由於編寫的時間倉促,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正,書中的內容會不斷更新在我的blog上,也歡迎您將錯誤和建議傳送郵件至我的信箱,期待能夠聽到讀者的真摯反饋。
致謝
感謝原騰訊同事王輝和電子工業出版社張月萍老師花費大量的時間、精力來閱讀我的書稿,指出許多文字和格式上的錯誤。感謝原騰訊同事丁吉亮、熊衛協助校稿和提供素材。