簡介
服務水平協定(SLA)是在一定開銷(通常這個開銷是驅動提供服務質量的主要因素)下,為了保障服務的性能和可靠性,服務提供商與用戶間或者服務提供商之間定義的一種雙方認可的協定。它規定了服務等級和服務所必須滿足的性能等級(包括服務水平測量、服務水平報告和信譽及費用3方面),並使服務提供商有責任完成這些預定的服務等級。一個完整的SLA同時是一個合法的文檔,包括所涉及的當事人、協定條款所包含的應用程式和支持的服務、違約的處罰、費用和仲裁機構、政策、修改條款、報告形式和雙方的義務等。同樣,服務提供商也可對用戶在工作負荷和資源使用方面進行規定。
SLA過去主要被服務提供商用於對網路質量的保障,用來描述網路狀態的典型矩陣參數,一般包括網路的可用性、丟包率和傳輸延時。隨著電子商務的發展,SLA的功能逐步擴展至套用服務的解決方案領域,並以一種可查閱的形式提供給用戶。服務提供商需要在以往工作的基礎上,為用戶提供端到端的SLA。
實際上,SLA的保障是以一系列服務水平目標(SLO,Service Level Object)的形式定義的。服務水平目標是一個或多個有限定服務組件的測量組合。一個SLO被實現是指那些有限定組件的測量值在限定範圍內。在SLO操作時段範圍內,SLO必須被實現。但是由於Internet的統計特性,我們不可能總是實現這些保障,所以SLA一般都有實現時間段和實現比例。實現比例被定義為SLA必須實現的時間與實現時段的比值。例如,在工作負荷<100transaction/sec的前提下,上午8點到下午5點服務回響時間<85ms,服務有效率>95%,在一個月內的總體實現比例>97%。
目前學術界對SLA通用的定義為:SLA是協定雙方(服務提供商和客戶)簽訂的一個契約或協定,這個契約規範了雙方的商務關係、權利和義務。通常來說,SLA是在一定開銷下為保障服務的性能和可靠性,服務提供商與客戶之間定義的一種雙方認可的協定,一個完整的SLA同時也是一個合法的文檔,包括了所涉及的當事人、協定條款、違約的處罰、費用和仲裁機構、政策、修改條款、報告形式和雙方的義務等,其根本目的是讓合作雙方在契約執行之前達成一個清晰的共同願景,同時建立一定的機制限制各方的違規行為,鼓勵雙方努力達到或超過事先約定的目標。
SLA發展
SLA最早出現在1998年幀中繼論壇推出其服務水平定義實施協定(即FRF13)中,該檔案為幀中繼業務的幾個關鍵特性定義了可接受的參數,如幀傳輸延時、幀傳送率、數據傳送率和業務可用性(或者為正常運轉時間)。FRF13除了向幀中繼用戶描述具體的性能和可獲得的參數外,還有一個更加重要的目的,即它使幀中繼提供商自信能夠滿足自己制定的標準,從而向其客戶保證有能力提供可信賴的服務。各種各樣業務提供商緊隨其後,SLA產業開始萌芽。
租用線路和幀中繼連線早已經有了SLA,VPN等其它業務也迅速跨入SLA的行列。
AT&T、MCI WorldCom和Sprint這三大運營商是提供SLA的先行者。AT&T目前對幀中繼和ATM業務提供99.99%可用性保證,對IP業務提供99.9%的保證。MCI WorldCom對幀中繼業務提供99.99%的可用性,ATM業務為99.9%,對於IP業務的可用性承諾為100%。Sprint對運行在其
SONET骨幹網上的幀中繼、ATM和IP業務的可用性承諾為100%。
對於專線連線,Concentric Network提供100%可用性的保證(包括骨幹網路和本地環路),它還保證平均往返路程時延為80ms,每月的平均丟包率不超過1%。
隨著提供網際網路連線的公司如雨後春筍般湧現,SLA變得更加複雜。儘管一些提供商有服務保證,但是網際網路本身相對來說的不可預測性為這些試圖提供特定的性能水平的嘗試者們帶來了前所未有的挑戰。相信隨著這一市場的成熟,許多問題將會得到解決,提供商們也會致力於解決這些問題。
AT&T可為網際網路連線服務提供保障。例如,AT&T為其AT&T WorldNet企業撥號業務提供99.9%的可用性保證,這包括AT&T管理的任何客戶端設備以及從客戶端設備到AT&T的POP點的連線。如果AT&T無法達到這一要求,客戶根據該服務的一個月的連線費用可以獲得一天的賠償費。
總之,企業依靠SLA來獲得特定的功能水平、網路頻寬和正常運行時間的保證。來源於IDC公司的數據表明,在調查接受問詢的大公司(擁有超過2500名雇員的公司)中約97%在未來的12個月中需要有網路的SLA,SLA是在以商務為核心的計算機環境中確保穩固的QoS、性能和正常運轉時間的關鍵因素。IDC還預測市場對可管理和託管業務SLA的需求將從1999年的2.78億美元增加到2004年的8.49億美元。
SLA特點
附加性:SLA是基於IT外包商常規服務標準上所提出的性能附加需求,如可靠性、安全性、可用性等,因此SLA並不是全新的服務內容,而是一種全新的服務理念和方式。
量化性:SLA是以一個或多個業務性能指標為核心內容,並作為雙方協定的標準,其定義的內容要求能夠被量化表示,並對客戶額外付出的費用和IT外包商承擔的責任建立對應關係。
風險性:客戶通過SLA將業務可能失效的風險部分地轉嫁給IT外包商,外包商還需承擔不具備SLA業務提供或保障能力所帶來的隱形經營成本。
在具體的SLA條款中,服務提供商和客戶是構成SLA的基本角色,其中客戶是指基於契約關係接受服務的各種實體,包括涉及使用服務提供商提供服務的公司或組織和個人。在IT外包服務中,客戶是服務的最終購買者,而用戶是客戶組織中的個體,並不一定是購買服務的主體。服務提供商原意特指提供電信服務的公司或組織,隨著IT外包的發展,SLA中的服務提供商不僅僅局限於電信服務商,也適用於IT外包中各類的IT服務商,包括網際網路服務商、網路服務商、主機託管服務商、電腦維護商、系統集成商等,還可以是企業內部的IT部門。在整個IT服務提供的價值鏈中,一個SLA中的客戶可能是另一個SLA中的服務提供商,同樣的一個SLA中的服務提供商可能是另一個SLA中的客戶,其具有傳遞關係。
SLA生命周期
SLA相對應的產品服務的生命周期包括五個階段:
產品與服務開發階段:對SLA而言,開發階段的任務是根據客戶需求引發來制定SLA模版,SLA模版既可以針對新開發的業務,也可以針對缺乏SLA或需要改進SLA的已有的業務。這一階段的主要任務包括:明確客戶需求並映射為業務特徵,設計SLA服務質量指標,根據IT外包商現有的資源狀況,驗證技術可行性,制定出新的SLA模版。
談判和銷售:這一階段主要由IT外包商的商務部門和客戶共同完成,也可能需要藉助技術人員的幫助,銷售人員和客戶將根據預定義的SLA模版,進行詳盡的商談,就SLA中質量參數指標及其違例處罰措施進行討論和確定。
實施:即服務的提供、開通階段,該階段主要工作是進行業務實現方案的制定,由技術人員對服務進行端到端的SLA符合度測試,最終由客戶確認服務是否滿足SLA要求。
執行:在服務運行期間,雙方將不斷地收集服務質量數據,一方面,實時地捕獲和監測SLA違例事件;另一方面,周期性地統計、分析服務質量報告。SLA的違例預警事件將引發預防性的維護工作,SLA的違例事件也將引發進入SLA違例處理流程,周期性的統計分析報告將分別傳送給客戶和IT外包商,面向客戶的報告是針對單個客戶的,而面向IT外包商的報告還將綜合各類信息,為外包商進行分析和網路、業務規劃提供參考數據。
評估:這裡的評估指對較長時間內SLA運行情況的一個綜合、深入的分析和評估,其目的是對現有SLA業務進行最佳化,同時為新SLA產品的規劃提供參考依據。
客戶和服務提供商的整個合作過程貫穿SLA整個生命周期,在不同的階段需要套用到不同的SLA參數和管理方法,SLA整個管理和執行是一個反覆提高的過程,SLA的運用積極地推動了IT外包的發展進程。下一章本文將對SLA的發展歷史和現狀進行總結和歸納。
SLA優點
對於服務提供商SLA能夠提供很多益處,它們包括:
一種使自己的服務區別於別的服務提供商的服務的方式。在過去的一年裡,大多數服務提供商包括Sprint、MCI、UUNet、GTE、PSINeI等已經開始為他們的Web主機和虛擬網服務提供有效性保障。
讓用戶對這種服務質量與開銷相掛鈎的方式有一個清楚了解。就像一種說法“快捷、便宜、優質”,你可以同時擁有其中兩項。如果用戶想要得到很高的服務質量,那他們就必須妥協於速率或更高的開銷。如果用戶願意付更多的錢,服務提供商可以對傳送的服務質量給予保障。正是這種對質量的測量及管理使服務提供商能夠提供與價格相匹配的(銅牌、銀牌、金牌)服務,從而吸引更多高利潤的商業用戶。
對用戶的工作負荷和對資源利用提供一個清楚的規定。例如,對於一個Web伺服器在負荷小於8000req /min的前提下提供的性能保障是回響時問小於2s,但是如果負荷大於8000req/min時,這個保障是得不到保證。
提供給用戶一種如何對服務相關問題進行診斷和解決的通用語言。
加快服務質量問題的解決從而為用戶提供更好的服務。因為SLA的存在,服務提供商不得不從角戶的角度出發,甚至在用戶感覺到服務質量問題之前,將服務質量問題鑑別並處理,這樣能夠提供更好的服務。
擁有心滿意足的用戶。
對於用戶,SLA同樣提供很多益處:
用戶能夠對比多家服務提供商的服務質量從而選擇一個價格性能的折中點。用戶將SLA作為一個選擇服務的提供商的工具。
把管理和維護服務傳送設施的任務移交給服務提供商。作為一個企業它可以對外尋找服務設施提供商,但它仍對運作於該設施上的商業業務負責。這個選擇是基於對開銷和性能以及外部提供商對傳送所需的QoS實現能力和對SLA遵守能力的全盤考慮之上。
為審查服務提供商的遵守情況以及在服務保障未得到滿足時擁有服務商的服務能性能報表提供了條件。
SLA發展趨勢
描述不詳盡甚至有漏洞的SLA在網路出問題時能夠保護服務提供商免受處罰,但會損害用戶利益,讓用戶覺得受到欺騙,甚至會失去好不容易爭取到的用戶。以詳細條款給出的SLA不但能夠更好地滿足用戶的期望,還被認為是對用戶利益負責,從而使服務提供商更具有競爭優勢。
在與用戶制訂SLA的交流過程中,服務提供商將能更好地理解用戶的要求,就服務水平達到共識,還能幫助服務提供商提供等級服務,並根據服務類別收取相應的費用。有了這些詳細的信息,用戶也就可以根據服務提供商實際能提供的服務和自己的預算來調整對SLA的期望。
目前,服務提供商可能還未認識到服務報告矩陣的重要性。在現有的基本SLA中,矩陣信息包括網路的可用性、網路時延及網路故障的修復時間等。這些規範在將來定義基本SLA時將被繼續沿用。另外,由於網路的連線對商業終端用戶越來越重要,SLA矩陣也將會根據這些用戶需求進行適當修改或變動。正確的SLA管理平台使服務提供商能利用SLA矩陣的這些新特性更好地為用戶服務。一個成功的服務提供商應該能開發和提供更好地反映每個用戶使用連線情況的可測量矩陣。
網路開始滲入到用戶商業活動的方方面面,網路的崩潰給用戶所帶來的損失是無法估量的,用戶當然希望網路的可用性和穩定性得到保證。正是用戶的這種需求促進了服務規範SLA的發展。SLA矩陣特性從原來的簡單地對數據包進行計數和時延的測量開始,慢慢向與商業活動相關的SLA轉變。服務提供商要對商業用戶相關的SLA矩陣進行嚴密測量,這就需要更先進的SLA平台。提高服務提供商所提供的SLA是一個逐步過程,這個過程將為服務提供商提供一個更好地滿足用戶需要的機會。
大多數現有的服務水平協定契約對所有的用戶都採用同一矩陣,這對特定用戶來說,會出現在某一方面提供的信息太多,而在另一方面又不夠的情況。因此,未來的SLA必須針對不同的用戶群,讓每個用戶都能獲得足夠的有用信息。當然,對於服務提供商來說,這是有一定難度的,他們必須在理解這個難度的基礎上,不斷努力,從而提出讓用戶滿意的SLA。隨著SLA的提高和OSS的出現,服務提供商能夠在每個SLA層中加入更詳細的SLA管理特徵,使不同的SLA對用戶來說變得更有價值,值得他們付出額外的費用。
對於保證一定服務水平的服務提供商,用戶將會要求他們證明自己提供的服務確實達到了所定的標準。因此,在未來的SLA中,服務提供商除了為用戶提供一個單純的策略機制外,還應使用戶及時了解整個網路的性能狀況。這些額外的信息不但能幫助用戶定位故障,迅速找出問題的原因,從而更快地解決問題,而且還有助於用戶了解他們是否申請到正確的服務。
現有的SLA條款對於服務質量不能滿足預定目標的情況也做出相應的規定。例如,用戶有權終止協定而不受任何經濟處罰、用戶有權向服務提供商索取經濟補償等,用戶期望能在廣域網上獲得與在區域網路上相同的管理水平,那些既不能滿足協商好的SLA,又不能提供經濟賠償的服務提供商,是無法贏得用戶的。但是,隨著商業活動對網路服務依賴性的增強,用戶越來越關心服務質量下降對商業活動本身造成的影響,不再僅僅滿足於服務提供商為此而提供的經濟賠償,他們希望在服務崩潰時能有其它補救方法,挽救對商業活動造成的衝擊。
未來的SLA提出了一個真正根據服務質量付款的概念,要求服務提供商必須滿足一定的服務水平目標。如果服務提供商提供的服務質量達到預定的基本目標,用戶則支付常規費用;如果服務提供商提供的服務質量達到SLA規定的較高目標,用戶則為此支付一些額外開支。為了得到額外的利潤,服務提供商就必須想法提高所提供服務的質量。這就需要一個可擴展性好、靈活可靠的SLA管理平台,以方便對後台系統信息進行處理。