基本介紹
- 中文名:AutoStart
- 隸屬:Co-StandbyServer產品
- 基於伺服器:Windows 2000/2003, Solaris等
- 屬於:高可用性群集解決方案
- 優點:集靈活和易用於一體
- 類別:計算機
EMC|Legato AutoStar 產品介紹,失效切換的重要性,系統故障原因:,系統故障帶來負面影響及問題:,高可用性帶來的好處:,AutoStart 概論,AutoStart 構造及工作原理,AutoStart 高可用性群集系統關鍵特性,AutoStart 工作套用,AutoStart 功能模組及組件介紹,套用系統方案,
EMC|Legato AutoStar 產品介紹
美國EMC 公司是企業級網路數據存儲和保護的領導者。作為美國存儲業領導廠商
——EMC 公司的一個獨立的軟體部門,Legato 提供給用戶既高效又方便的解決方案。因此,為
我們的用戶提供在Windows,Linux 和UNIX 平台上的、全面的數據保護管理領域的優秀的軟體
系列產品,是用戶能實現跨平台、跨系統的網路數據存儲及保護功能,以期簡化用戶系統管理,
實現網路數據自動化管理,是Legato 一直以來的任務。Legato 的目標是向用戶提供真正有價值
的網路數據管理一體化產品,使基於網路的企業級數據管理更加簡易,包括各種桌面系統和服務
器,各種各樣的磁碟陣列。
失效切換的重要性
主機的故障性停機將對應用程式的正常運作造成很大影響。 儘量減少Downtime(故障
停機時間)是十分必要的。
系統故障原因:
§伺服器電源中斷
§無法修補的應用程式故障
§資料庫故障
§系統出現超載運行
§網路資源故障
§關鍵性作業系統程式出現故障
§人為錯誤
§自然災難
系統故障帶來負面影響及問題:
§系統及硬體供應商不能提供即時技術支持
§不能估計系統恢復時間
§浪費時間解決故障,影響生產力
§客戶或管理階層對公司失去信心
§公司形象受到負面影響
高可用性帶來的好處:
§保證系統上的數據、服務及套用的連續性及可達性
§減低系統故障帶來的影響
§減低客戶機/伺服器架構的維護成本
§避免單點故障
在伺服器發生故障時,雖可人工地進行數據恢復和後備伺服器的切換啟動,但整個過程
所需時間的長短在很大程度上取決於當時的故障複雜程度和系統管理人員的技術水平等等。人為
因素很多,難以保證很快恢復系統運行。
Clustering 技術是將多台伺服器聯在一起,組成一個高度透明的大型系統,讓最終用戶能共
享網路上的所有資源,如數據或套用軟體等。當其中任何一台伺服器出現故障時,另外的伺服器
便立即自動取代該故障機器的職責,繼續為用戶提供服務。
AutoStart 概論
現在您可以消除因為關鍵性套用及通訊中斷所帶來的損失。AutoStart 是新一代群集軟體,
它可以對應用程式進行監視、修復、重新啟動和故障排除,從而為用戶的系統提供前所未有的保
護,保證系統上的應用程式、數據和網路資源不會受到任何外在因素影響而中斷服務。
AutoStart 所獨有的恢復應用程式特性,能及時地切換故障應用程式到其他指定的伺服器
上。除了能保證故障套用的可用性外,還確保了原伺服器的其它應用程式不受故障和切換影響而
繼續運行。另外,創新的Peer-to-Peer 結構,能群集多達一百台伺服器,共同組成一個強大而靈
活的群集組。
AutoStart 構造及工作原理
模組設計,集靈活和易用於一體,使你僅需配置所需要的部分。
§ AutoStart 群集管理控制台擔當聯繫通信、監視系統資源的任務程式提供健全服務,共享群
集組的狀態信息。
§ AutoStart 環境軟體控制台將提供直觀的安裝和靈活的集成,並監視重要系統資源。通過
AutoStart 環境控制台,可擴展AutoStart 基本功能,使它支持不同品牌的管理程式、網路協定、
檔案系統及各類RAID 的產品。
§ AutoStart 模組通過AutoStart 的模組,客戶能有效地管理系統的各部分,以提供高可用性
支持。此外,它能配合AutoStart 環境控制台,並透過AutoStart 命令中心進行監視,管理控制。
AutoStart 支持幾乎所有的資料庫管理、監控和切換,套用模組包括:
·
MSSQL
· Exchange
· Sybase
· Oracle
· Informix
· IIS 4.0
· EMC SRDF
· Checkpoint Firewall-1
· Encina
· Tivoli
· Web
· NetWorker
· NFS
§ AutoStart 的切換的一般程式:
–檢測以確認需要切換
–停止相關套用
–釋放相關資源
–檔案系統同步
–備用機獲取相關資源
–啟動相關套用及網路通道
§ AutoStart 支持的網路環境包括:
–Ethernet
–Fast Ethernet
–FDDI
–CDDI
–ATM
§ AutoStart 支持所有至少雙口的磁碟,包括:
–SPARC Storage Array
–Storage Dimensions
–EMC Symmetrix, Clariion, FCxx, IPxx,
–Sun A5X00, A1000, D1000, T3
–RSM2000
–Multipack, Unipack
–DEC
–All two Channel SCSI
§ Legaot AutoStart 支持File Systems 及 Volume Managers
–NFS ver 2 and ver 3
–Journaling File Systems
–Sun Solstice Disksuite
–Veritas VxFS
–Veritas VxVM
–UFS
AutoStart 高可用性群集系統關鍵特性
AutoStart 以下幾方面的關鍵技術可以提供用戶系統強大的可用性,可管理性和擴展性:
AutoStart 支持多達100 台伺服器的群集組合,AutoStart 能按客戶發展需求,增加AutoStart
群集伺服器及所載應用程式數量;提供故障監察、修復、重新啟動及排除故障功能;能單獨修復個
別故障套用,縮短系統復原時間;動態負載調節,確保故障出現時,應用程式能平均地分布在不
同伺服器上;靈活、可靠、可調的群集構造,為日後擴展作好充分的準備;模組構造和開放式APIs
與現在系統的各個環節配合,確保端對端可靠性;協同資料庫及RDBMS 數據備份伺服器;提供中
央管理,監察群集組內不同的UNIX 平台。
高性能的系統和套用的高可用性針對任何需保護的套用,無須改變套用配置。AutoStart 提
供功能及相應的技術包括:
§ 單一系統映象(SingleSystem Images)。即將整個集群環境中的資源視為一個整體。
AutoStart 使用單一的配置資料庫(複製多份以避免單點失效)、統一的管理規則和集中的套用腳本
將整個系統中的資源形成一個資源集,或者說將整個分散式系統形成一個系統。由此帶來了更高
的資源可用性和更簡便的管理和使用。
§ SAN-Ready。AutoStart 對集群內的主機數量沒有限制,並提供多TCP/IP 連線、獨立網路
檢測、通過FibreCable 或SAN 的通信和利用磁碟作為通道等多種方式進行心跳偵測和通信。因
此可工作在包括SAN 在內的多種網路結構中。與SAN 的良好結合可提供SAN 用戶更高的套用
和數據可用性,使用戶的SAN 環境發揮最大的功效。
§ Adaptive Computing Environment: AutoStart 可以通過所提供的“events “ 和“rules “引擎
來感應計算機事件。這些事件可以發生在套用,數據,系統和網路上面,可以是計畫內也可以是
突發性系統故障。 AutoStart 可以對這些事件做出適應性反應,引發另外一些“解決性動作”來保
證系統上資源的獲得性。
§ 智慧型式監測及恢復: AutoStart 使用智慧型式決策過程來檢測和恢復伺服器和應用程式的故
障(能檢查的故障包括, 應用程式、網口失效或磁碟控制器) 。當檢測出故障時,AutoStart 能精
確地計算出群集組內哪個伺服器最適合接管故障應用程式,並確保只有哪些出現故障的部分才被
轉移,避免對其它正常運行的程式造成混亂。
穿AutoStart 群集組的重要資源提供 “故障負載平衡”。 當伺服器出現故障時,AutoStart 能平均
地把應用程式按設定分布在不同的群集伺服器上,避免單台伺服器出現超載情況,減低用戶的效
率。
§ 跨平台群集: AutoStart 能支持多達100 台伺服器的群集組合,並能監視群集內每個套用
程式的運作。支持2000/2003 和Linux。整個企業可採用一個群集方案來管理。目前支持的平台
有Sun Solaris, Windows 2000/2003, HA-UX, IBM AIX, Linux Red Hat。此外,“Peer–to-Peer”的群
集結構避免了不必要伺服器及硬體配置而造成的額外開支。AutoStart“開放式”及“非干預式”設
計,使它能支持不同作業系統包括UNIX 及2000/2003 平台,也能支持不同的資料庫和磁碟陣列
等系統配置。異構平台集群將企業系統環境中由於平台不一致而相分隔的資源結合成為整體。由
此帶來更大的資源共享能力和整個系統的服務級可用性。
§ 可調性和可擴容性:利用AutoStart,可以先從兩個伺服器,單個磁碟開始,然後根據個別
企業的需求增長,再增加配置。AutoStart 模組配置將為資料庫,網路伺服器和其它伺服器提供
可調和可擴容性的功能。
§ 面向套用的群集及自動切換:AutoStart 面向套用的集群技術,保證了集群中的任何一個服
務器在作為某一套用主伺服器的同時,可以作為運行於其它伺服器中套用的後備伺服器。在這樣
換,保證套用的連續性。
§ 應用程式的恢復: AutoStart 同時提供單故障應用程式切換及伺服器切換。當伺服器或應
用程式出現故障時,AutoStart 立即切換故障的服務組到其它伺服器上,使原伺服器及其它的應
用程式得以繼續運行而不受影響,回憶系統復原所需的時間。
§ 中央管理、方便使用: AutoStart 的命令中心提供一個由JAVA 編寫的圖形用戶界面
(GUI),讓用戶輕鬆地管理群集組內部伺服器及所載的應用程式。這不但能以生動形式顯示群
集組內各伺服器,服務組及應用程式的情況,也能監察在其它地區運行的AutoStart。Legato 的
SNMP 模組更能兼容其它SNMP 配置集成,保障了對網路管理的投資,改善系統的管理能力和
降低管理成本。
§ 模組,開放式結構和APIs:AutoStart 開放式結構及為特殊應用程式編寫的各種模組,讓
您能因應信息環境需求,與AutoStart 天衣無縫地集成起來。例如,連線不同資料庫如Oracle,
Sybase, Informix 模組,配合特殊關鍵套用模組,如Web Server, NFS,Firewall,LotusNotes 及
AutoClient 等等。客戶更能通過AutoStart 提供的API 把附加的應用程式及其它關鍵性資源歸納
在群集組中。通過AutoStart管理控制台進行檢測及監視,當檢測出應用程式發生故障時,AutoStart
將竭力在本地網路對它們進行恢復或確定群集組中最佳伺服器接管這個負載。AutoStart 被驗證
明能與各種RAID 產品集成及支持多種網路技術。
AutoStart 工作套用
做後備的。當伺服器發生故障時,該伺服器上的套用將轉移到有最高優先權的其它備份伺服器上。
· 網路(Network): 儘管伺服器的狀態穩定,但網路發生故障對於客戶的訪問同樣是非常致
命的。每台機器擁有備份的套用網路接口可以預防網路故障。擁有備份的套用網路接口,系統可
以提供故障檢測和自動切換,在主要網路發生故障時自動切換到同一台伺服器上的備份網路上。
客戶的訪問是透明的。基於同樣的想法,AutoStart 使用兩個心跳網路。
在的一個分區。無論如何劃分,Windows 2000 所在的系統分區不能被鏡像。而該磁碟上的其它
分區可以被鏡像。稍後將詳細討論。AutoStart 支持所有的硬碟控制器和所有與Microsoft Windows
2000 兼容的存儲設備。包括SCSI、IDE、SSA、RAID 和其它形式。
資源鏡像Resource Mirroring
AutoStart 比只複製檔案和目錄的軟體更加強大,伺服器所有的身份和功能都能夠被鏡像,
包括:磁碟、IP 地址、共享、列印佇列、甚至應用程式。伺服器資源的類型決定了複製的方法。
這些方法包括:
1) 為管理磁碟/分區做磁碟/分區鏡像。
2) 為管理套用做註冊表的保護。
3) 為IP 地址、伺服器名、印表機和共享做內置應用程式接口(APIs)。
磁碟/分區鏡像Disk/Partition Mirroring(僅限於Windows 平台)
AutoStart 提供了一個全新的磁碟鏡像引擎,從而避免需要一個獨立的物理磁碟。早期的
的版本要求每個伺服器至少需要兩個或三個物理磁碟來完成一個主/從或主/主方式的配置。新的
鏡像引擎允許單獨地管理或鏡像一個磁碟上的多個分區。
當一個Windows 2000 卷作為一個被管理資源進行配置時,該鏡像引擎就被調用。每一個
在被管理分區上的數據塊都被鏡像/複製到鏡像對兒的另一個磁碟設備上。這一過程很像在一個
伺服器內部的磁碟複製,只不過鏡像對兒中的磁碟分別在不同的伺服器上。當鏡像對兒中每個磁
盤設備上所有的數據塊同步之後,該鏡像對兒被認為是健康的(Health)。當鏡像對兒是健康狀
態時,對於關鍵任務數據的訪問有兩條途徑。首先,每個集群伺服器都有一份最新的數據拷貝。
如果網路上的用戶突然失去了對集群中一個伺服器的訪問,失效切換進程將把失效伺服器身份切
換到存活伺服器上。允許用戶重新獲得對鏡像數據的訪問。第二,在鏡像對兒中,因為兩個
區對待。如果一個伺服器上的I/O 卡或磁碟驅動器失效,對於數據的訪問不會發生任何事情。因
為在鏡像對兒中還有一個激活的I/O 卡或磁碟驅動器存在。就像在單個伺服器的內部進行磁碟復
制一樣,其中一個失效不會有任何影響,用戶還可以從鏡像對兒中存活的驅動器上訪問數據。(類
似於RAID 1)
新的AutoStart 鏡像過程不要求作業系統在定義或重定義一個鏡相對兒後重新啟動。
AutoStart 用它自己的過濾驅動程式通過Legato Remote Management Console 鏡像驅動器。該驅動
程式總是被載入的,所以,對於鏡像對兒的任何改變,用戶無需重啟。
· 檔案系統(FileSystem): 當執行許多檔案操作時(建立/插入/更新),伺服器發生故障會
造成許多檔案/檔案系統更新的丟失。因此,在系統重新啟動恢復時,檔案系統的重新檢測是一
定要做的。FSCK 對於檔案系統的修復是必須的,其時間會根據更新檔案的數目和大小而變化。
這種修復非常花費時間。因此建議使用別的檔案系統(e.g.VxFS)。這不僅能快速恢復一個錯誤
的檔案系統,而且它通過使用自己的日誌檔案,在不需要人工干預下就可以保證數據檔案的一致
性。不管檔案系統的大小和數目,系統都可以做到快速完成檔案系統的檢測。
存在的,服務的失敗可以被獨立處理,切換到集群內其它最合適的伺服器上並且不會影響到本服
務器上其它服務的運行。對那些IP 不相關的套用,僅僅套用數據需要切換,而在IP 相關的套用
中,相關的IP 地址也需要切換。根據套用的重要性,套用可以有選擇地被切換到別的機器上,
如果套用中的某一個發生錯誤,那些與它共享一個IP 地址的套用也需要被切換。如果那些共享
一個IP 地址的套用需要分別的切換,那么每個套用都應有一個獨立的IP 地址。
AutoStart 功能模組及組件介紹
1. AutoStart Modules
Legato Cluster 可以保護任何套用,但是對於一些常見的套用可以提供更高的管理能力以使
套用的性能達到最佳。
AutoStart 套用模組目前有:Oracle, Sybase, Informix, NFS, Networker, Web , Apache, Gauntlet
Firewall, Checkpoing Firewall, Encina, IIS, 和EMC SRDF。
2 . AutoStart Firewall
有兩個版本的AutoStart Firewall 作為保護防火牆的解決方案
主要特點為:
集中的管理和控制
可與AutoStart 配合實現企業整個環境的集群
* AutoStart Firewall for PGP/NAI Gauntlet; 包括AutoStartE(Enabled with Deptkey); AutoStart
Firewall for PGP/NAI Gauntlet;
* AutoStart Firewall for Checkpoint Firewall-I: 包括AutoStart(Enabled with Dept key);
AutoStart Modules for Checkpoint Firewall-I
3. Legato eAutoStart
LegatoeAutoStart 是保護那些需要與CiscoLocalDirector 或者其他工作負載平衡方案,諸如:
F5、Resonate 或者Microsoft 解決方案一起運行的Web 伺服器的解決方案。
特點:
在不影響Web 服務性能的情況下提供系統24x7 的可用性;
可監控CPU 負載、回響時間等影響系統性能的關鍵因素;
可與Legato Cluster Firewall 結合,形成完整體系;
集中的控制台
Legato eAutoStart 組件包括:
* AutoStart Enterprise;
* AutoStart Modules for IIS;
* AutoStart Toolkit for Web(HTTP 監控)
* AutoStart Toolkit for Apache Web Service
Legato wanAutoStart
Legato wanAutoStart 廣域網套用保護方案,提供將套用從一個地點移到另一個地點,跨地域
保護的災難恢復方案,以預防地震、火災或人為操作等造成的對業務的影響。
特點:
據可用性;
無距離限制;
管理簡便。
可與用戶自定的數據鏡像技術集成
系統支持:
Solaris 2.8,9,10
HP-UX10,20 或11.x
Windows 2000/2003
EMC Symmetrix 及SRDF
套用系統方案
根據客戶的需求,兩台IBM Server 通過SCSI 口與1 個ADTX StorEdge 磁碟陣列連線。
Autostar 需求:每台 IBM Server 內配置4 個Ethernet 網口,系統配置TCP/IP。
1、其中兩個Ethernet 口接Private network 作為HeartBeat 線,這些HeartBeat 線通過交叉線
對接。Heartbeat 組成為 IBM Server 間的私用網,用於相互監視對方的健康狀況。(為更加安全
可靠,Heartbeat 線留有備份Heartbeat 2,當一條線有故障時,另一條可繼續提供服務)。
2、其餘單機上的兩個Ethernet 網口可配置為互為備份,接在Public Network 上。Cluster 系
統的關鍵在於消除“單點故障”(Single Point of Failure),即保證不會出現因一個部件失效而造成整
個系統癱塌的情況。
備 (DiskArray)。一旦某個部件出現問題,冗餘部件會自動接管工作,從而消除故障對整個系統
的影響。在正常情況下,兩台 IBM Server 各自為用戶提供相應的服務,當一台伺服器有故障時,
它所提供的服務會按照預定的優先權切換到其它機器上。那兩個互為備份接Public network 的網
口,在正常情況下只有一個在工作,當出故障時,另外一個將接替其工作。
Firewall,Web 以及用戶套用的高可用性的支持。
5、在正常情況下,每台 IBM Server 運行各自的Application, 每個Application 對應相應的
網路客戶、檔案系統及套用;當一台 IBM Server 故障發生時,可以在較短的時間內將相應的網
絡、檔案系統及套用切換到另外一台主機上,在性能足夠的情況下,並不影響對方主機的其他應
用正常運行。