災備演練

災備系統建設完成後,面臨的災難不外乎數據級別、套用系統級別和災備中心級別這三種。

基本信息,沙盤推演,模擬演練,實際業務接管演練,

基本信息

通常,災備系統建設完成後,面臨的災難不外乎數據級別、套用系統級別和災備中心級別這三種。因此,所有的演練都是基於這三種級別中某一特定的場景而進行的,災難場景不同,演練的技術過程也不相同。
一般而言,幾乎所有的災備系統的災難恢復預案的最初版本都是根據建設目標假設的場景提出的,這樣的災難恢復預案的有效性以及流程是否能夠符合企業IT部門應對災難的需求,都需要企業IT部門對人員技術儲備、各種資源協調、災難恢復過程組織等等進行多次多場景的演練驗證來確認。
演練的目的決定演練的方法,通常演練方法分為沙盤推演、模擬演練及實際業務接管演練三種。

沙盤推演

沙盤推演也叫“桌面演練”,是在“模擬演練”前進行的,沙盤推演是對初始災難恢復預案的一個理論驗證,所有參加演練的人員和部門以會議方式,按照預先準備的災難場景的災難恢復預案,由參加演練的人員描述自己負責的任務模組的回響和處理過程。
沙盤推演可以檢驗災難恢復預案和時間安排是否合理、人員組織是否有效、參演人員職責分工,技術儲備及處理過程是否達到預案要求。推演的結果與恢復預案的差距,進而完善恢復預案。

模擬演練

模擬演練以沙盤推演結果(最佳化後的災難恢復預案)為基礎,模擬演練由IT部門與相關業務部門參加。它是對可能發生的災難的處理過程的虛擬操作,通過模擬演練來驗證災難恢復預案是否可以達到預期的目標。
模擬演練啟用實際的災備系統來實現系統和業務恢復,採用模擬數據和模擬業務系統運行來驗證演習預案。目前許多災備技術可以完全提供不影響現有生產系統和容災系統的災備中心啟動功能,因此可以在災備中心隨時獲得真實的災備系統啟動環境並且可以在這個環境中施加套用系統的各個模組。演練的處理過程是高度接近真實災難發生時的處理過程,通過演練可以檢驗災備系統的可用性、災難恢復預案的可行性以及增加參演人員對災難處理過程的感知度,參演人員對整個災難處理流程的熟悉程度和各自負責任務的熟練程度,增加災難處理過程中各環節參加人員配合的默契程度。
通過模擬演練來進一步完善沙盤推演階段形成的災難恢復預案,發現演練流程中存在的問題,總結演練中指揮,控制,通信等的有效性,時間安排的合理性以及資源調用,調配是否滿足演練的需求。
模擬演練是一種對現有生產環境沒有影響的演練方式,但是可以實現災難恢復預案的比較完整的驗證。

實際業務接管演練

實際業務接管演練與災難發生時處理的結果一樣,需要災備中心真正接替生產運行一段時間。實際業務接管演練可以最大限度的檢驗災備系統的災難恢復能力和災難恢復預案。驗證災備中心在災難發生時的實際業務處理能力。在實際業務接管演練中,數據回切是一個比較複雜的環節。對於數據回切,有以下兩種方式處理:
災備中心運行階段驗證正確之後,放棄驗證的數據,直接啟動生產中心繫統恢復生產。
將災備中心運行的數據,以增量方式恢復到生產中心,在生產中心啟動生產。這種方式具有較大風險,如果設定的災難場景是大型災難(如地震等),數據的回切則可能以全量方式進行。
絕大多數企業的災備系統演練都需要按照目標和風險度來設計。災備演練的三種方法,以遞進的方式從紙面理論到實際操作,從業務模擬到業務實際參與等不同層面,不同深度來驗證已建成災備系統的可用性,有效性,通過演練結果來修正、補充、完善災備恢復預案並為災備系統的升級建設提供理論依據及數據指標,從而使企業在信息系統災備建設中有據可依,從而保證建成的災備系統能充分實現建設的目的、達到建設的目標。
達到災備演練的目標和完善預案是災備演練的設計宗旨,對企業而言,切忌貪大造成不必要的生產風險和浪費。

相關詞條

熱門詞條

聯絡我們