基本含義 從而在原文中獨立出來單獨貯存的程式或檔案副本。(摘自《
計算機科學 》)
備份 備份分類 備份可以分為系統備份和數據備份。
1、系統備份:指的是用戶作業系統因磁碟損傷或損壞,計算機病毒或人為誤刪除等原因造成的系統檔案丟失,從而造成計算機作業系統不能正常引導,因此使用系統備份,將作業系統事先貯存起來,用於故障後的後備支援。
2、數據備份:指的是用戶將數據包括檔案,資料庫,應用程式等貯存起來,用於
數據恢復 時使用。
備份作用 備份的作用是用於後備支援,替補使用。
備份是
容災 的基礎,是指為防止系統出現操作失誤或系統故障導致數據丟失,而將全部或部分數據集合從套用主機的硬碟或陣列複製到其它的存儲介質的過程。傳統的數據備份主要是採用內置或外置的
磁帶機 進行
冷備份 。但是這種方式只能防止操作失誤等人為故障,而且其恢復時間也很長。隨著技術的不斷發展,數據的海量增加,不少的企業開始採用
網路備份 。網路備份一般通過專業的
數據存儲 管理軟體 結合相應的硬體和存儲設備來實現。
備份方式 定期磁帶備份數據。
遠程
磁帶庫 、光碟庫備份。即將
數據傳送 到遠程備份中心製作完整的備份磁帶或光碟。
遠程關鍵數據+磁帶備份。採用磁帶備份數據,生產機實時向備份機傳送關鍵數據。
遠程
資料庫備份 。就是在與主資料庫所在生產機相分離的備份機上建立主資料庫的一個
拷貝 。
網路數據 鏡像 。這種方式是對生產系統的資料庫數據和所需跟蹤的重要
目標檔案 的更新進行監控與跟蹤,並將更新日誌實時通過網路傳送到備份系統,備份系統則根據日誌對磁碟進行更新。
遠程鏡像磁碟。通過高速
光纖通道 線路和磁碟控制技術將鏡像磁碟延伸到遠離生產機的地方,鏡像磁碟數據與主磁碟數據完全一致,更新方式為同步或異步。
數據備份必須要考慮到
數據恢復 的問題,包括採用
雙機熱備 、
磁碟鏡像 或容錯、備份磁帶異地存放、關鍵部件
冗餘 等多種災難預防措施。這些措施能夠在系統發生故障後進行系統恢復。但是這些措施一般只能處理計算機單點故障,對區域性、毀滅性災難則束手無策,也不具備災難恢復能力。
備份技術 系統災難恢復 (IDR=Intelligent Disaster Recovery ) 系統災難恢復,就是在系統出現崩潰的時候,能夠用非常少的步驟,將系統重建,包括上面的系統補丁、套用軟體和數據。這樣可以提高恢復的準確性、縮短恢復時間、縮短業務中斷時間。
採用公用的一張光碟,所有的系統都採用這一張光碟。這個光碟可以啟動系統,同時可以啟動網路,然後備份
伺服器 將備份在
磁帶庫 (或者虛擬帶庫)中的整個硬碟內容或者第一
主分區 內容恢復到災難機。這樣不論災難機原來有多大容量數據,都可以存放在整個備份系統的
備份設備 中,統一進行管理,而且不需要經常刻光碟,也就是說光碟不需要經常更新。比較典型的代表是BakBone NetVault VaultDR。右圖是BakBoneNetVault VaultDR災難備份和恢復的數據流,所有系統採用統一的光碟進行。
需要針對每台計算機單獨刻光碟,恢復的時候需要利用針對性的光碟來恢復,每台機器都需要自己的光碟,而且需要定期不斷更新。這種方式的最大不足是經常要刻光碟,否則災難出現的時候如果沒有光碟或者光碟太久了,都會影響恢復的速度和恢復後的狀態。這種技術的典型代表是EMC NetWork Recovery Manager模組。
恢復時需要藉助網路啟動,也就是需要具備一台相同作業系統的
主機 作為引導機器,然後利用備份的內容進行恢復。這種技術的典型代表是Symantec NetBackup的Bare Metal Restore(裸金屬恢復)模組。
作業系統自己提供的災備工具。對於大多數Unix
小型機 ,都提供系統
備份工具 。藉助於系統自身提供的
磁帶機 ,利用一個簡單的命令,HP-UX採用make_recovery就可以把整個root卷備份到
伺服器 自帶的4mm磁帶上。在恢復的時候,這盤磁帶可以自啟動系統,採用一個命令就可以將整個root卷恢復到硬碟上。這種方式的好處是簡單和經濟,尤其對於Unix系統,這樣的方式遠比備份軟體提供的BMR模組方便、安全和經濟,因為備份軟體提供的BMR模組往往需要相同平台的其他伺服器來啟動。
數據遠程複製 將數據在另外的地方實時產生一份可用的副本,此副本的使用不需要做
數據恢復 ,可以將副本立即投入使用。數據複製的最大好處是副本數據立即可用,沒有數據恢復時間,RTO 非常好,同時因為是實時複製,RPO也非常好,幾乎不會丟失數據。缺點是費用遠比數據備份要高,不僅僅是數據
複製系統 價格高,還需要另外的
硬碟存儲 空間和
主機系統 ,甚至建立另外的遠程
機房 ,考慮網路布線,這些都將帶來成本大大增加,所以數據複製的建設和維護費用遠遠大於數據備份。
數據複製目前有如下實現方式:
基於
主機 。基於主機的數據複製技術,可以不考慮
存儲系統 的同構問題,只要保持主機是相同的作業系統即可,存在支持異構主機之間的數據複製軟體,如BakBone NetVault Replicator就可以支持異構
伺服器 之間的數據複製,可以支持跨越廣域網的遠程實時複製。缺點是需要占用一點主機資源。
基於存儲系統。利用存儲系統提供的數據複製軟體,複製的數據流通過存儲系統之間傳遞,和主機無關。這種方式的優勢是數據複製不占用主機資源,不足之處是需要災備中心的
存儲系統 和生產中心的存儲系統有嚴格的兼容性要求,一般需要來自同一個廠家的存儲系統,這樣對用戶的災備中心的存儲系統的選型帶來了限制。
基於
光纖交換機 。這項技術正在發展中,利用光纖交換機的新功能,或者利用
管理軟體 控制光纖交換機,對存儲系統進行虛擬化,然後管理軟體對管理的
虛擬存儲 池進行
卷管理 、卷複製、卷
鏡像 等技術,來實現數據的遠程複製。比較典型的有Storag-age,Falcon等。
基於套用的數據複製。這項技術有一定局限性,都是針對具體的套用。主要利用資料庫自身提供的複製模組來完成,比如OracleDataGuard,Sybase Replication 等。
數據保護技術 CDP(Continuous Data Protection)
CDP 技術是目前最熱門的數據保護技術,它可以捕捉到一切檔案級或
數據塊 級別的數據寫改動,可以對備份對象進行更加細化的粒度的恢復,可以恢復到任意時間點。
CDP技術是一個新興的技術,在很多傳統的備份軟體中都逐漸融入了CDP的技術。比如BakBone NetVault Backup 8.0 追加了TrueCDP模組,Symantec Backup Exec12.5等。其他公司包括EMC,Symantec都併購了一些CDP的軟體,正在和傳統地備份軟體進行整合,還都在整合中。
CDP技術包括兩種:
Near CDP,就是我們說的準CDP,它的最大特點是只能恢復部分指定時間點的數據(FPIT,Fixed Point In Time),有點類似於
存儲系統 的邏輯快照,它無法恢復任意一個時間點。如Symantec 、CommVault、
凱備份 的CDP都屬於這種類型。
TrueCDP,我們稱之為真正的CDP,它可以恢復指定時間段內的任何一個時間點(APIT,Any Point In Time),而BakBone TrueCDP屬於TrueCDP類型。
當前套用情況 如果採用災備方案的分布在各個行業,不過大家都是按照一定的梯度來使用。
首先採用的是系統災難備份(BMR Bare Metal Recovery),因為這種方案成本最低,只要在建設數據備份系統的時候追加一些模組就可以完成。不需要附加的存儲空間,也不需要附加的
容災 機房 ,所以,有條件的用戶幾乎都可以實施。只不過有的用戶採用作業系統提供的備份工具來輔助,有的用戶採用備份軟體提供的災難模組來完成。這樣的
用戶數量 最大,分布在各個行業。BakBone 的VaultDR在使用BakBone NetVault的備份軟體用戶中被廣泛採用。很多用戶非常喜歡BakBone VaultDR不用關心作業系統類型,而且一張標準光碟可以套用到所有Intel x86
伺服器 進行災難備份和恢復。
其次是建立
容災系統 的用戶,大數據量的高端企業普遍採用基於存儲的數據複製技術,比如電信、金融行業。中低端用戶普遍採用基於
主機 的數據複製軟體,成本較低,而且不需要進行嚴苛的
存儲系統 採購,尤其是BakBone的NetVault Replicator不但可以進行遠程數據複製,而且可以支持異構平台,所以在國內外有廣泛的用戶,一些政府部門、電力公司、證券部門、網站公司等都採用這種方式,而且大多運用在Windows、Linux平台。基於存儲交換機層的
虛擬存儲技術 雖然也在有了一些用戶,但是因為此技術起步時間有限,技術成熟度需要進一步驗證,很多用戶只是做為試點,沒有大範圍的展開。對於基於套用的數據複製方式,也有部分
高端客戶 在採用,而且也有大量的用戶。
對於CDP技術,才剛剛起步,這種技術滿足了很多關心災備的用戶的需求,在RTO 和RPO方面都能得到很高的標準,同時還可以進行任意
歷史版本 的重現,正在被越來越多的用戶所關注,相信將來會有非常廣泛的用戶。BakBone的TrueCDP可以進行任意時間點的恢復,是真正意義上的CDP,將會比其他準CDP產品有更大的優勢,會被更多關心災備的用戶所選用。
套用誤區 災備系統因為能夠帶來業務的連續性,正越來被大家所重視,但是在使用過程中也要切記出現一些誤區。
沒有選擇適合自己的。沒有仔細分析和明確業務連續要求,對RTO和RPO沒有進行仔細研究,要么不做,要做就想追求最全面的,這樣可能忽視了最需要的建設,沒有切實滿足自己的需要。
認為災備系統是萬能的,誇大災備系統的作用,忽視了備份系統、高可用系統的建設。其實各個系統都有自己的作用,需要根據實際需求進行建設。
沒有有步驟分階段的進行災備建設,總想等實際成熟的時候全面建設,甚至還沒有先進行數據備份系統的建設,就開始著手進行災備系統建設。不進行備份系統建設,就沒有滿足
數據安全 的底線,在關鍵時刻缺少一份完整的數據,而花費大量的財力進行災備系統建設,反而得不償失。
多種災備技術的選用不合理,比如
主機系統 的資源可以接受基於主機的複製軟體來運行,卻選用了基於
存儲系統 的設計,造成必須選用相同類型的存儲設備,增加了總體費用。
對BMR系統災難備份總是希望選用備份軟體自帶的BMR模組。其實,備份軟體自帶的BMR模組對於Window和Linux比較方便,但並不是對於所有的Unix系統都合適,在Unix系統備份方面,Unix自帶的系統備份工具和自帶的
磁帶機 就非常方便,一個命令就可以完成系統備份,還不用依賴於其他
伺服器 ,遠遠勝於一些備份軟體自帶的BMR模組,不但操作方便,而且減少費用。
未來發展方向 未來的技術發展應該是多種技術並存,而且越能滿足客戶需求的方式更能得到客戶的關注。
未來的發展之一應該是基於
主機 的異構複製技術會有更廣泛的市場。因為大多數客戶具備異構主機環境,支持異構環境的數據複製技術,就可以利用現有環境,各台主機之間互為複製。對於不支持異構環境的複製軟體,就需要購買相同的存儲或者購買相同作業系統的主機進行數據複製,增加了災備的總體費用。
未來的發展之二就是CDP技術。
CDP 融合了數據備份和數據複製的優點,既可以進行實時數據保護,還可以任意時間點的歷史
數據恢復 ,將會具有更加強大的生命力。隨著TrueCDP和傳統備份軟體的無縫銜接,將會有越來越多的用戶採用TrueCDP 進行災備系統建設。右圖是廣為流行的BakBone NetVault TureCDP 備份系統架構圖。
備份系統 備份系統的作用 很多
系統管理員 認為,投資建立一個備份任務的管理,較原來複雜的備份系統只是在恢復的時候才起作用有些浪費,並且平時增添了很多的管理任務,這對於企業來說是一個大的浪費。
這個問題是一個大問題,直接涉及到對於一個企業的信息系統的
投資回報率 (ROI)。當IT系統的重要性非常高,企業的關乎生命的數據都在計算機系統裡面,那么數據的保護就非常重要,這是其一。另外,實施備份系統並不會帶來更多的管理任務,相反為系統管理員帶來了很多維護上的方便,主要有以下幾點:
備份的自動化,降低由維護員的操作帶來的風險;
檔案系統及資料庫數據的時間點恢復,歷史版本管理;
磁帶的複製(Cloning),可降低磁帶的出錯幾率和實現
異地容災 保存;
系統災難快速恢復。
因此,如果企業必須實現上述功能,而企業又不實施備份系統時,需要的人力及設備的投資如果大於實施備份系統的投資,則該備份系統的投資是可以被接受的。
備份系統的功能 用戶只需要簡單的備份就可以了,不必要那么複雜。用戶買了很多備份系統中沒有用處的先進技術,沒有必要在系統中實現過多的複雜功能。
備份系統實現的功能是備份技術發展到一定階段的產物,先進技術的出現也由於用戶的系統中有這樣的需求。當IT系統發展到一定程度,用戶對IT系統的依賴型增強,IT系統的數據量越來越大,對系統備份的要求就水漲船高。但好的備份系統應該有如下的特點:
備份系統可根據套用系統的需要非常容易地進行擴展;
滿足未來的數據量及套用系統升級帶來的備份系統的壓力;
備份系統中,尤其是備份軟體的可升級能力。
總體來說,備份技術已經經歷了幾個發展階段,從傳統的磁帶備份到
網路備份 ,從SCSI
LAN-Free備份 到SAN結構的動態共享LANFree備份,直到出現的Serverless備份。可以預見,未來備份產品有以下幾個趨勢:
磁碟備份 狀況 隨著SATA磁碟價格進一步下降,磁碟的備份優勢逐漸體現出來。EMC已經推出了使用磁碟作為
虛擬磁帶庫 的產品,在功能上可以替代磁帶庫的功能。筆者認為,該產品的大批量投放市場,會在一定程度上引發備份硬體設備的升級換代。
iSCSI技術 該技術可以利用現有的TCP/IP網路進行數據傳輸,用戶可以很方便地實現數據的遠程異地保護。市場上已經出現了較多這樣的產品,相信隨著產品的成熟,會有很多
異地備份 和
容災 方案會選擇該技術。
NDMP協定 NDMP(
網路數據管理協定 )作為一種標準,已經發展到了Version 4,支持該協定的產品,可以非常方便地實現NAS
伺服器 數據的快速備份和恢復。對於大數量的小檔案,該技術有著得天獨厚的優勢。
備份技術 很多的
磁碟陣列 都提供了SnapShot功能,而對於磁碟陣列上的SnapShot,我們可以充分利用SnapShot技術進行數據的Serverless備份,這對於企業級的大型系統有著十分重要的意義,極大地降低了備份時對於生產系統的資源占用,並且可以非常快速地恢復。
實現備份介質的生命周期管理
通常每盤磁帶都有一定的使用次數限制,因此,對於磁帶備份系統來說,磁帶使用了一定次數後,就應該摒棄掉,不能用來備份關鍵數據。
維護 人們投資購買了全自動的備份系統,目的就是降低維護工作量,只要實施了該系統,維護工作就可以放鬆了,只要過一周或者一個月檢查一下備份的狀態就可以了。
當用戶實施了備份系統後,對於備份系統的維護工作仍然非常重要。主要由以下因素決定。
由於很多單位IT系統的主機很多,套用系統很多,並且每套套用系統都有相應的管理和維護人員,備份是各種套用數據備份任務的集中管理。因此對於套用系統較為複雜的用戶來說,可以設立備份
系統管理員 或者存儲備份工程師,對整體備份系統進行維護。
隨著數據量的增大,套用系統的增長,備份策略隨著時間的遷移應進行最佳化。
備份系統涉及的技術包括作業系統、資料庫、存儲、
磁帶庫 等諸多技術,因此建議備份系統管理員對各種知識有一定的了解,並且除了參加備份系統知識的培訓外,還要參加作業系統、資料庫等產品的專業培訓,以保證套用系統在出現災難時儘快實現數據的恢復。
關鍵資料庫的日常備份如果失敗,可能導致資料庫的掛起。例如,對於
Oracle資料庫 來說,如果不及時對資料庫的“
歸檔日誌 ”進行備份,則會導致整個資料庫的停止。
如果磁帶庫備份系統中有“克隆”的功能,還需要每日將“克隆”的介質取出,放置到異地保存,以利於
容災 。
產品 在選擇產品時,備份
磁帶庫 容量儘可能大,
磁帶機 速度儘可能快,儘可能使用最先進的技術。
在產品的選擇過程中,性價比是最重要的指標之一,但絕不是全部。建議用戶在選擇產品的時候考慮以下幾個因素:
本系統套用數據的類型、數據量、備份策略(
全備份 、
增量備份 等)及關鍵數據的保留時間決定了磁帶庫的總容量;
備份時間視窗和備份數據量的峰值數據量決定了磁帶機的最低數量;
套用系統的種類和數據類型決定備份時採用哪些技術。
如用NAS設備備份,儘量選擇NDMP備份;SAN架構備份儘量選用磁帶機動態共享;
磁碟陣列 提供了
鏡像 或者SNAP功能,可以使用SnapShot備份技術。
磁帶機 技術的選擇方面,建議選擇較為通用的設備,對於該磁帶機來說,作業系統及備份軟體對其兼容的程度較好。
由於磁帶機屬於機械設備,故障率較磁碟、光碟等設備要高,因此配置磁帶機時儘量保持
冗餘 。SATA磁碟技術有了突飛猛進的發展,磁碟備份技術已經成為了發展方向。
硬體設備考慮備件的提供情況及提供商的服務水平,而對於備份軟體來說,提供專業服務及技術支持也是需要考慮的重要因素。
備份軟體應該具有較廣泛的兼容性。
數據容災 企業關鍵數據丟失會中斷企業正常商務運行,造成巨大經濟損失。要保護數據,企業需要備份
容災 系統。但是很多企業在搭建了備份系統之後就認為高枕無憂了,其實還需要搭建容災系統。數據容災與數據備份的聯繫主要體現在以下幾個方面:
數據備份基礎 數據備份是數據高可用的最後一道防線,其目的是為了系統數據崩潰時能夠快速的恢複數據。雖然它也算一種
容災 方案,但這種容災能力非常有限,因為傳統的備份主要是採用數據內置或外置的磁帶機進行
冷備份 ,備份磁帶同時也在
機房 中統一管理,一旦整個機房出現了災難,如火災、盜竊和地震等災難時,這些備份磁帶也隨之銷毀,所存儲的磁帶備份也起不到任何容災功能。
容災與備份 真正的數據
容災 就是要避免傳統
冷備份 所具有先天不足,它能在災難發生時,全面、及時地恢復整個系統。容災按其容災能力的高低可分為多個層次,例如國際標準SHARE 78 定義的容災系統有七個層次:從最簡單的僅在本地進行磁帶備份,到將備份的磁帶存儲在異地,再到建立套用系統實時切換的
異地備份 系統,恢復時間也可以從幾天到小時級到分鐘級、秒級或0數據丟失等。
無論是採用哪種容災方案,數據備份還是最基礎的,沒有備份的數據,任何容災方案都沒有現實意義。但光有備份是不夠的,容災也必不可少。容災對於IT而言,就是提供一個能防止各種災難的
計算機信息系統 。從技術上看,衡量
容災 系統有兩個主要指標:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了當災難發生時允許丟失的數據量;而RTO則代表了系統恢復的時間。
容災不僅是技術 容災 是一個工程,而不僅僅是技術。很多客戶還停留在對容災技術的關註上,而對容災的流程、規範及其具體措施還不太清楚。也從不對容災方案的可行性進行評估,認為只要建立了容災方案即可高枕無憂,其實這具有很大風險的。特別是在一些中小企業中,認為自己的企業為了數據備份和容災,整年花費了大量的人力和財力,而結果幾年下來根本就沒有發生任何大的災難,於是放鬆了警惕。可一旦發生了災難時,後悔晚矣!這一點國外的跨國公司就做得非常好,儘管幾年下來的確未出現大的災難,備份了那么磁帶,幾乎沒有派上任何用場,但仍一如既往、非常認真地做好每一步,並且基本上每月都有對現行容災方案的可行性進行評估,進行實地演練。
數據容災等級 設計一個
容災備份 系統,需要考慮多方面的因素,如備份/恢複數據量大小、
套用數據中心 和備援數據中心之間的距離和數據傳輸方式、災難發生時所要求的恢復速度、備援中心的管理及投入資金等。根據這些因素和不同的套用場合,常見的容災備份等級有以下四個:
本地冷備份 這一級容災備份,實際上就是上面所指的數據備份。它的
容災 恢復能力最弱,它只在本地進行數據備份,並且被備份的數據磁帶只在本地保存,沒有送往異地。
在這種容災方案中,最常用的設備就是
磁帶機 ,當然根據實際需要可以是手工載入磁帶機,也可以是
自動載入磁帶機 。前者主要適用於存儲數據容量較小的中小型企業。