IT服務連續性

IT服務連續性

IT服務連續性,起源於業務連續性,是業務連續性的子集。IT服務連續性最佳實踐是業務連續性最佳實踐與數據中心業務特點相結合的產物。IT服務連續性知識體系的開創者是《IT服務連續性實現指南》一書的作者姚強。

基本介紹

  • 中文名:IT服務連續性
  • 外文名Best Practices For Ensure Continuous IT Services
  • 所屬學科IT
定義,原理,特點,套用,

定義

IT服務連續性,是IT服務這個對象的屬性之一。IT服務的屬性包括安全性、可靠性、可維護性、可用性、連續性、可管控性、可擴展性、經濟性等。
“IT服務連續性”指在主IT資源失效後備份資源的恢復能力。IT資源連續性指標主要包括高可用恢復時間指標、災難恢復時間指標(災難RTO)、災難恢復時間點指標(災難RPO)。
IT服務的連續性能力、可靠性能力和可維護性能力共同決定了IT資源的可用性能力。
下面分別定義IT服務的可靠性、可維護性、可用性:
“IT服務可靠性”指IT資源穩定運行的能力,通常用平均無故障工作時間(MTBF)來度量,例如,某路由器的MTBF達到20000小時,則該路由器在正常環境下使用時的故障率低於0.438次/年。
“IT服務可用性”指IT資源在一定時限內的可用率。例如,某個套用系統的可用性達到99.99%,則該套用系統每年的停機時間小於53分鐘。IT資源的可靠性能力、可維護性能力和連續性能力決定了IT資源的可用性能力。
“IT服務可維護性”指IT資源可進行日常維護和自檢、可產生故障報警、可通過配件修復等方面的能力,通常用平均維修時間(MTTR)來度量。
IT服務連續性知識體系的開創者是中國大陸第三位DRII(國際容災協會)業務連續性專家認證(認證號10180)的獲得者姚強,他曾服務於IBM、EMC(Dell)、SUN(Oracle)、Centrin、Teamsun等企業,曾在IT服務連續性領域進行了20多年的探索、實踐與創新,曾通過清華大學出版社發表《IT服務連續性實現指南》一書,該書在全球範圍內首次將業務連續性最佳實踐全面套用於IT領域,開創性地建立了IT服務連續性知識體系,促成了業務連續性全球最佳實踐在IT領域的落地,促進了IT服務連續性人才的培養,幫助眾多數據中心實現了“少停機、少丟數、少花錢”的夙願。

原理

IT服務連續性實現指南一書共有15個章節,各章內容概要如下:
第二章 剖析IT服務
本章內容旨在通過面向對象的方法讓讀者對“IT服務”形成透徹的認識,主要包括4部分內容:
1. 介紹IT服務的屬性,包括功能、性能、可擴展性、可靠性、安全性、可管控性、連續性、時段性、可用性、經濟性。
2. 介紹IT服務在企業生產要素框架(包括產品與服務、業務、各實體生產要素、數據中心)中的定位。
3. 介紹業務(包括關鍵業務目標、業務屬性、重要業務、核心業務、業務流程之間的關係、業務流程之間的啟停次序)及IT服務和業務的關係。
4. 介紹IT服務在數據中心生產要素框架中的定位,介紹IT資源及其與IT服務的關係,介紹IT流程及其與IT服務、IT資源的關係,介紹IT組織及其與IT流程、IT資源、IT服務的關係。
第三章 剖析IT事件
本章全面介紹IT事件的來龍去脈,讓讀者對“IT服務”形成透徹的認識。主要包括6部分內容:
1. 分析IT事件的前因,介紹IT威脅源和IT威脅源消減措施。
2. 定義IT事件的類別。
3. 介紹IT事件的後果,定義IT損害的類型,分析IT事件影響的衍變過程並詳細介紹了IT服務影響、業務運營影響、企業影響、社會影響。
4. 介紹IT事件級別的劃分方法。
5. 闡述IT事件與業務運營中斷事件的關係“IT事件和由此引發的業務運營中斷事件是一個事件,只是從IT視角和業務視角來分別命名,只是從事件的起因和事件的結果來分別命名”。
6. 闡述IT服務連續性的意義
第四章 全景展現災難性IT事件
本章通過8個分鏡頭真實還原某銀行因機房火災導致生產中心災難的案例,讓讀者身臨其境般感受了企業各條線執行IT事件應急回響與災難恢復行動的全部過程,旨在幫助讀者直觀認識重大IT事件應急處置相關的團隊、資源、流程、任務。
第五章 IT事件應對過程
介紹整個企業範圍內的IT事件應急處置活動框架,介紹每項任務的執行細節,為企業各條線執行IT事件應急聯動任務提供詳細指引。
第六章 IT應急處置機制
本章詳細介紹IT條線在IT事件應急處置過程中需要具備的三類機制,為IT條線開展IT應急處置機制建設提供指引。
第七章 企業層面IT事件應急處置機制
本章詳細介紹企業層面在重大IT事件應急處置過程中需要具備的應急組織、應急預案、應急場地,為企業層面開展重大IT事件應急聯動準備活動提供指引。
第八章 業務條線IT事件應急處置機制
本章詳細介紹業務條線在IT事件應急處置過程中需要具備的應急組織、應急預案、應急場地,為業務條線開展IT事件應急聯動準備活動提供指引。
第九章 IT應急處置機制開發過程
本章詳細介紹IT應急處置機制開發活動框架中的各項活動,為數據中心開展IT應急處置機制(包括IT應急回響機制、高可用備份機制、災備機制)建設提供系統化的方法論。在本章中,作者基於自己多年來對IT服務連續性理論和實踐的不斷總結和提升,提出了許多獨到的見解,定會讓讀者耳目一新。
第十章 IT服務連續性管理過程
本章介紹“確保IT應急處置機制能夠全天候為IT服務連續性保駕護航”所必須的IT服務連續性管理活動框架(包括IT服務連續性規劃、IT服務連續性設計與實施管理、IT服務連續性運維管理、IT服務連續性風險管理、IT服務連續性績效管理、IT服務連續性內部控制、IT服務連續性內部審計等),闡述每項管理活動的管理目標、核心管理活動框架、管理角色與職責、管理過程、核心管理活動的方法步驟等。本章內容旨在彌補國內數據中心在IT服務連續性管理方面的短板,為數據中心的IT服務連續性管理活動提供系統化指引,增強IT管理者對事後恢復的信心。
第十一章 IT服務連續性管理體系
本章依據“體系”的定義原則,即“目標一致、相互之間存在緊密作用、歸屬同一個知識領域、具有共同的清晰邊界的要素構成一個體系”,定義IT服務連續性管理體系框架。該框架首次清晰界定了IT服務連續性知識體系與其他IT知識體系的邊界、界定了IT服務連續性資源與其他IT資源的邊界、界定了IT服務連續性活動與其他IT活動的邊界、界定了IT服務連續性團隊與其他IT團隊的邊界。本章還介紹“定義IT服務連續性管理體系的意義”,包括推動IT服務連續性知識體系的專業化發展、促進IT服務連續性行業的專業化分工、促進數據中心繫統化地開展IT服務連續性管理體系建設活動。
第十二章 IT服務連續性管理體系的邊界環境
本章逐一介紹IT服務連續性管理體系的邊界要素,旨在幫助IT服務連續性管理人員形成全局性、系統性認識。
第十三章 IT服務連續性內審關鍵審核事項
本章從IT服務連續性知識領域出發,針對IT服務連續性審計活動框架中的每項審計活動,詳細羅列關鍵審計事項、審計標準、被審計人員、需要獲取的證跡,為IT內審人員提供迄今為止最切合實際、最完備、最詳細、最具針對性的IT服務連續性審計指引。
第十四章 IT服務連續性管理體系成熟度模型探究
本章基於實現IT服務連續性目標的客觀需求及COBIT定義的“DS4 Ensure Continuous Service”第5級成熟度模型,首次建立IT服務連續性管理體系的最高級成熟度模型。
附錄A 高可用風險檢查列表庫
本附錄旨在為IT風險評估與管理人員提供一個基本的生產環境高可用風險檢查列表庫。主要內容包括:
1. 網路系統高可用風險檢查列表
2. 主機系統高可用風險檢查列表
3. 套用軟體系統高可用風險檢查列表
4. 資料庫系統(Oracle)高可用風險檢查列表
5. 資料庫系統(Informix)高可用風險檢查列表
6. 機房環境系統高可用風險檢查列表
7. 存儲系統(EMC DMX)高可用風險檢查列表
8. SAN高可用風險檢查列表

特點

IT服務連續性實現指南一書是一本系統地、全面地闡述IT服務連續性知識體系的專著,旨在為社會培養IT服務連續性領域的人才,為數據中心開展IT服務連續性活動提供詳細指引,幫助數據中心實現“少停機、少丟數、少花錢”的夙願。
該書基於大量圖表,直觀地闡述以下內容:IT服務連續性涉及的IT服務、業務、IT資源、IT流程、IT組織和IT事件等方面的基礎概念和知識。企業各條線的IT事件應急處置行動框架與IT事件應急處置機制。以IT服務連續性目標為導向建設IT應急回響機制、高可用恢復機制和災難恢復機制的活動框架。IT服務連續性管理活動框架,包括實現IT服務連續性所必須具備的項目管理、運維管理、IT應急處置機制就緒管理、風險管理、IT應急處置機制持續更新管理、績效管理、內部控制和內部審計活動。
該書的讀者對象包括IT應急管理人員、IT規劃設計人員、IT項目管理人員、IT運維管理人員、IT風險管理人員、IT績效管理人員、IT內部控制人員、IT內容審計人員以及準備邁入數據中心大門的所有IT人士。
該書發行於2016年,作者後續將出版新版本,補充雲計算、分散式系統相關的IT服務連續性知識。

套用

很多數據中心在IT應急處置機制建設方面的投資巨大,但IT系統仍然頻繁宕機、系統恢復時間仍然頻繁超標。“重技術、輕管理”只是表面原因,切實可行的IT服務連續性活動框架的嚴重缺乏,才是問題的癥結所在,“巧婦難為無米之炊”才是IT人員的真實寫照。
IT服務連續性知識體系的目標是補好IT服務連續性這塊短板、培養IT服務連續性領域的人才、幫助數據中心實現“少停機、少丟數、少花錢”的夙願。
IT服務連續性知識體系致力於解決數據中心在IT應急處置機制建設和管理過程中普遍遇到的、最迫切的下述問題:
1.數據中心的“業務”是IT服務相關的需求分析、規劃設計、採購實施、交付與支持、控制改進等過程,數據中心的“業務”有其自身的鮮明的特點,當今的業務連續性方法論和最佳實踐對數據中心“業務”的連續性只能提供高層次的指導,並不能提供實現數據中心“業務”連續性所需要的詳細的IT服務連續性活動框架。
2.缺乏整個企業範圍內的“IT事件應急處置行動框架”,導致數據中心IT應急處置行動與企業其他條線的IT事件應急處置行動難以協調聯動、往往銜接不暢。
3.缺乏系統化的“IT應急處置機制開發活動框架”,導致數據中心在IT應急處置機制建設階段無法從實現IT服務連續性這個總體目標出發去進行IT服務連續性總體需求分析、總體規劃設計,而是各自獨立地開展IT應急回響機制建設、災難恢復機制建設、高可用恢復機制建設,導致這些機制之間往往銜接不暢。
4.缺乏“IT服務連續性管理活動框架”,再加上IT應急處置機制的複雜性及日新月異的IT環境,導致IT應急處置機制投產後可能會隨時失效或處於IT服務連續性能力不可確定的狀態,最終結果是IT高級管理人員對IT服務連續性能力缺乏信心、甚至巨大的IT投資付諸流水。
5.由於以上IT服務連續性活動框架(由IT事件應急處置行動框架、IT應急處置機制開發活動框架和IT服務連續性管理活動框架組成)的缺失,導致數據中心難以完整地、明確地定義IT服務連續性團隊、角色和職責,難以體現 “誰主管誰負責”的原則,導致“人人有責,人人都不負責”,最終結果是隱患不斷、亂象叢生。
6.在IT服務連續性內審方面,由於缺乏對IT服務連續性活動框架的整體認識,IT內審人員難以全面把握關鍵審核事項,導致IT服務連續性治理的薄弱。

相關詞條

熱門詞條

聯絡我們