容災主要是指災難恢復(Disaster Recovery),隨著IT技術的發展,各種業務對IT系統依賴程度的加深,對IT系統提供連續服務的要求也越來越高,容災概念逐步演變為業務連續性(BusinessContinuity)概念
基本介紹
- 中文名:ERP系統容災
概念演變,系統問題,目標,常見問題,系統構建,
概念演變
過去,容災主要是指災難恢復(Disaster Recovery),隨著IT技術的發展,各種業務對IT系統依賴程度的加深,對IT系統提供連續服務的要求也越來越高,容災概念逐步演變為業務連續性(BusinessContinuity)概念,在中國,這兩個概念基本是等價的,主要包含以下三個方面的要求:
2. 連續操作(Continuous Operations)能力:它是指當所有設備無故障時保持業務連續運行的能力。用戶不需要僅僅因為正常的備份或維護而需要停止套用的能力。
3. 災難恢復(Disaster Recovery)。它是指當災難破壞生產中心時,在不同的地點恢複數據和套用系統的能力。
實際上,這三個方面的要求是有所重疊的,總體來說,就是要求企業應具有應對風險的能力,在軟硬體故障和災難發生時,在允許的時間範圍內,繼續提供相應水平的業務服務。
系統問題
美國《CIO雜誌》2008年曾經對大量企業的CIO們做了一次調查,85%的受訪企業同意或十分同意他們的ERP系統攸關公司核心業務的推動,而且“不能沒有它”。核心ERP模組主要包括會計及財務套用、採購、訂單和供貨商管理、庫存管理、客戶關係管理和人力資源管理與薪資福利等,應該說,ERP系統已經成為很多企業的命脈,它管理了企業的核心數據,是企業信息化工作的神經中樞,成為企業在資訊時代生存和發展的基石,一旦ERP系統停止運行,將對企業造成巨大的損失。
下表列出了一些著名的ERP災難,可以看出ERP系統出問題對企業造成的損失:
公司名稱 | 原因 | 損失 |
OverStock | ERP新功能上線引發其他功能的設計問題 | 1420萬美元 |
Hershey Foods | 萬聖節前夕,新上線的SAP供應鏈系統出錯導致1億美元產品無法發貨 | 當季收入下降19%,股票下跌8% |
Nike | ERP的供應鏈系統和後台辦公系統升級出錯 | 銷售損失1億美元,股票下跌20% |
Levi Strauss | 將分散在多個國家的多個SAP系統整合到一個統一系統時出錯 | 2008年2Q淨收入下降98% |
HP | 北美零散系統整合到統一的SAP系統,問題不斷,項目嚴重超支,5倍於預算 | 項目支出1.6億美元 |
…… |
目標
建設ERP容災系統的目的是保證在災難造成對ERP業務數據的破壞後,能快速恢復業務數據和ERP系統,使之在可接受的時間內恢復提供可接受水平的業務服務,最小化因災難造成的負面影響,降低企業聲譽損失,提高客戶滿意度。
所以,在ERP容災系統建設之初,首先要分析本地區影響業務數據安全性的災難有哪些種類,ERP容災系統需要能夠防範哪些災難?確定允許容災系統丟失多少數據(RPO,RecoveryPoint Objective)?最大可接受的數據和系統恢復時間是多長時間(RTO,RecoveryTime Objective)?
常見問題
常見的ERP容災方案經常存在以下兩個嚴重問題:
大量ERP容災系統都只具有數據備份能力,而不具備系統切換能力。在真正災難發生時,只是保證了數據有備份,但不能做到及時恢復系統,不能保證業務連續性,部分容災方案只能單向切換,可以從生產系統切換到容災系統,一旦原生產系統恢復,需要從容災系統切回到原生產系統,就非常麻煩。
很多ERP容災方案中,容災系統是Standby的,不是Active的,也就是不可用。企業投入了大量資源,在沒有災難發生時,平時只能作為數據備份系統閒置,不能做到“平戰結合”,資源利用效率極低。
系統構建
1、容災效果:需要防範哪些災難?允許多少數據丟失(RPO,Recovery Point Objective)?多長時間系統恢復?(RTO,RecoveryTime Objective)?
2、投資回報:不同容災方案硬體投資差別非常大,備份系統有的是Standby的,有的是Active的,對投資回報的影響也很大
3、對生產系統的影響:需要考慮容災系統對生產系統的性能影響和安全性影響,有的容災系統需要在生產系統上安裝高許可權程式,占用較多資源,並影響生產系統的可用性和安全性
4、技術開放:容災技術是否與硬體平台和存儲型號無關?否則容易被捆綁在特定廠商上,對後續商務談判和後續技術選型不利
5、可用性:這個非常重要,有兩個方面的考慮,一是容災技術是否會降低生產系統可用性,如果採用同步方案,生產系統、容災系統和備份系統是串聯關係,整體系統可用性是三個系統可用性的積,取決於可用性最低的那一個;二是需要考慮容災技術的可用性,有些容災技術不能保證備份系統是可用的,實際災難發生時,無法按預期啟用備份系統,將造成極大損失
6、容錯性:必須考慮容災系統本身的容錯性,有的容災技術,容錯性比較差,需要很多人工干預,或者經常需要重新初始化,使用起來很不方便,也存在很大問題。