簡介,遠程數據複製傳輸規則,同步複製規則,異步複製規則,半同步複製規則,數據容災技術,常見數據保護技術,數據備份技術,鏡像技術,快照技術,複製過程的數據一致性,遠程數據複製基本架構,DRBD,NBD,
簡介
各種計算機上的數據信息己經成為開展辦公與業務的重要基礎,數據信息已經成為現代企事業單位與個人的重要無形資產。當計算機系統遭到諸如自然災害、軍事打擊或惡意破壞等災難時,計算機系統的軟硬體、數據信息、系統和對外提供服務的能力都會受到不同程度的損壞,而數據的丟失或者減損顯然會給計算機系統的依賴者造成不同程度的損失,這種損失有些時候甚至是難以彌補的。
傳統的高可用技術採用數據備份和集群技術可以避免由於各種軟硬體故障、人為誤操作以及病毒造成的破壞,但當面臨突發的大規模災難性事件時,上述技術根本無法提供大範圍的保護。
遠程數據複製技術利用通信技術、計算機技術實現遠程的數據備份,減少數據丟失帶來的損失。
遠程數據複製傳輸規則
在遠程數據備份的數據複製傳輸規則方面,目前傳統的規則有同步、異步和半同步複製規則,可以基本保證不同套用對數據複製的需求。
同步複製規則
同步複製規則,指通過複製軟體或智慧型硬體系統,將本地生產數據以完全同步的方式複製到異地,每一本地I/O交易均需等待遠程複製的完成傳送一個WriteAct應答予以釋放。這種複製規則之下的遠程備份數據與本地數據的實時性強,災難發生時遠程數據副本與本地數據完全同步。但本地伺服器性能受網路的影響較大,體現在本地伺服器I/O速率下降。同步複製規則一般套用在數據傳輸距離較短的同城系統或者專線專網連線的異城系統,有些關鍵業務嚴格要求遠程複製採用同步複製規則。
異步複製規則
異步複製規則,指通過複製軟體或智慧型硬體系統,將本地生產數據以後台同步的方式傳送到異地,每一本地I/O在進行的同時將讀寫請求發往異地系統,無需等待遠程系統的任何回應只要本地I/O完成即可返回。本地數據的遠程複製通過數據複製緩衝區進行,具有不影響本地伺服器交易、傳輸距離較長、受遠程網路影響較小的特點。異步數據複製規則在軟體容災方式中廣泛採用,為了使本地伺服器性能不受到複製操作的較大影響,許多非關鍵套用選擇這種遠程複製規則。但是在網路頻寬較小或網路阻塞較大的情況下,這種複製規則導致遠程數據副本比本地數據略有延遲
半同步複製規則
半同步複製規則,指備系統的緩衝區接收到了數據塊並不等待寫完就向主系統傳送一個RevAct應答,這時主機的I/O便可以返回,一定程度上提高了主機的反應效率,又確保備機至少收到了需要寫入的數據,從而減少了數據丟失的風險,但本質上與同步複製的速率差不多,只是相差一個備系統寫磁碟的時間。
這三種傳統的數據複製規則雖然主機I/O返回的時機不同,但本質上都嚴格保證主備機上數據更新的順序相同,這樣做可以很好的保證雙方的數據一致性,但是由於每個用戶數據更新請求都會引發一次網路數據傳輸,而許多應用程式都存在很短的時間內對同一區域多次提交的可能性,這導致用傳統規則集合進行的工作方式將造成一定的頻寬浪費,在網路頻寬較小或數據傳輸量較大的情況下會增加網路阻塞的機率,而且也會引起主機的性能下降。
數據容災技術
數據容災技術旨在建立一個異地的數據備份系統,該系統是本地關鍵套用數據的一個實時複製,當本地數據甚至整個套用系統發生災難時,系統至少在異地保存有一份可用的關鍵業務的數據。該副本可以是本地數據的完全實時複製,也可以是比本地數據略有滯後但保持數據完整性的數據備份。
容災的目的是保證套用與業務的連續性,保證業務能夠連續的前提是防止數據的丟失。一切套用與業務在計算機上的運行都要依賴於數據,沒有數據,套用與業務就無從談起。如果數據不能實現容災,那么套用容災與業務容災就根本無法實現。所以構建一個性能良好的數據容災系統是實現大規模業務容災系統的基礎,是考量容災系統性能的必要因素。評測容災系統性能時,數據的遠程丟失率也是重要的性能指標。這一切都說明數據容災技術一直都會是容災系統中的熱點研究方向。
常見數據保護技術
數據備份技術
數據備份技術按照執行備份時套用服務是否暫停可以分為冷備份與熱備份。冷備份即我們通常所說的備份,技術人員或程式定期的將磁碟中的數據拷貝到備份磁碟上。以往主要採用主機內置或外置的磁帶機或磁碟對數據進行冷備份,可以滿足數據量較小,數據存儲方式簡單的數據備份需求,並且方法簡單、成本較低。但隨著部門計算機套用的擴大,數據信息量成幾何級數增長,並且數據存儲在越來越複雜的分散式網路環境上,異構的套用與數據也增大了冷備份的難度,所以冷備份方式越來越不適應當今套用對數據保護的要求。為了提高這種冷備份的效率,研究者提出了一系列的備份策略,如全備份、增量備份和差額備份,一定程度上提高了冷備份的效率,使得冷備份這種技術在目前仍然是一些低端用戶基於經濟因素考慮的選擇。相對於冷備份,熱備份又稱為線上備份或數據複製,具有數據備份實時性較高的特點。根據複製原理的不同主要有基於鏡像、快照等技術的線上備份方法。
鏡像技術
網路實時數據備份技術和瞬間數據備份技術是兩種相輔相成的技術,是數據容災技術的一個主要研究與發展方向。網路實時數據備份可以有效地保證業務伺服器端發生設備故障或其它一些非傳播性災害時備份數據非常接近故障發生前的業務數據,並且可以與集群系統結合提高系統的可用性但是為了保證在發生病毒侵襲或者人為誤操作這種具有傳播性的災害後數據仍然可用,必須採用瞬間實時備份技術,及時創建物理上隔離的副本。
快照技術
快照技術是目前較為流行的
熱備份技術之一,屬於瞬間數據備份技術。它是指通過軟體將某個與數據存儲相關的源對象,如檔案、資料庫、磁碟子系統或邏輯卷,在某一時刻的全部信息進行保留,形成一個快照對象,訪問此對象,就可以得到邏輯卷或者磁碟子系統在某個歷史時刻的映像。
快照技術的原理是通對源對象的快速掃描,建立一個快照對象,由一組指向快照和不變數據塊的指針,和用於保存即將要修改的數據塊的快照組成。快照對象在邏輯上與源對象擁有相同的容量,但卻不是源對象的完全副本,它通過指針共享源對象上的數據。快照可以說是某一時刻數據的瞬間的拷貝,能夠在保證數據安全下保證數據的可用性,它不需要拷貝數據,只要記錄檔案或塊的信息,幾秒鐘即完成。當快照對象創建完成後,便可對源對象在快照時刻的數據信息進行線上數據分析,數據挖掘,測試和備份等目的的操作,而不會影響源對象的當前讀寫操作。與遠程複製技術相比,快照技術可以方便地對數據的多個歷史狀態進行維護,並且需要較少的存儲空間,但當用戶只關心數據的遠程熱備份時,套用快照對象卻不能實現數據的實時複製。
複製過程的數據一致性
對於大部分用戶來說,進行數據複製、備份以及鏡像等工作的最終目標不僅僅是為了獲得一個數據備份,最主要的目標是在主存儲介質發生故障時,可以利用備份的數據進行恢復或者把應用程式遷移到備份的數據上重新啟動。因此,備份或者複製、鏡像數據的可恢復性是衡量上述各種技術的關鍵因素。以資料庫管理系統Oracle為例,在事務的執行過程中需要按照特定的順序依次更新控制信息、數據表等。如果複製過程中不能保持數據更新順序,則可能造成複製的數據是不可用於恢復的。
遠程數據複製基本架構
當前比較流行的數據遠程實時備份方案是使用DRBD或者是NBD。這兩款軟體結構清晰,代碼精煉,比較靈活。DRBD專注於實現數據遠程實時複製的基本功能NBD專注於實現數據遠程共享的基本功能,將它與軟RAID結合也能夠達到數據遠程備份的功育旨。
DRBD
DRBD是在LINUX下運行的能夠實現基於磁碟塊設備的一對一遠程鏡像的開源軟體。在聯網的兩台機器上安裝DRBD後,配置雙機的主備,即可實現由主到備的複製。
DRBD提供了三種複製規則同步複製規則protocol C、異步複製規則protocol A、半同步複製規則protocol B。可以在配置檔案中指定複製使用的規則,並且兩台主機之間可以配置多個同步資源resourse 0…resourse n。
DRBD的設計思想是通過配置檔案將網路上兩台主機上的物理磁碟分區對應到的DRBD虛擬共享設備drbd0上,應用程式需要寫本地磁碟時會通過這個虛擬設備同時將數據寫到遠程的磁碟分區之上。DRBD允許用戶在遠程機器上建立一個本地塊設備的實時鏡像, DRBD運行於兩台計算機之間,可以由用戶設定數據同步的方向以實現數據同步,也可以與配合,將同步磁碟作為heartbeat的可支配資源,由heartbeat來決定數據的同步方向。DRBD提供的是塊一級的複製,其典型套用就是備份應用程式的數據以實現套用的切換。
NBD
NBD是Linux下運行的能夠實現遠程的數據存儲與共享的開源軟體。本地機器之上配置了client端之後即可像使用本地設備一樣使用遠程上配置了server端的主機的存儲資源,這個資源可以是一個磁碟塊甚至是一個檔案。本地的多個client可以共享一個遠程存儲資源,該軟體實現了數據的遠程存儲。作為增強版的ENBD,可以實現NBD設備上的分區並可以智慧型嵌入RAIDI鏡像。
NBD的設計思想可以看作是典型的NAS存儲技術:它可以減輕套用伺服器的負擔,同時在網路作業系統上不需任何軟體就可以做到數據共享。NBD提供實時並且離站的存儲和備份,這點正是我們需要的網路存儲的特性—它實現了數據與主機的分離。可以接合軟
RAID使用,以提供一個廉價的網路RAID解決方案。NBD的檔案系統通常是建立在塊設備上的,也就是說NBD比傳統的NAS技術更底層,因此可以在它上面建立任何檔案系統。安裝了NBD的數據伺服器為節點提供數據訪問,並可以根據套用的不同提供不同的遠程存儲設備。