《基於容錯代價的雲計算可生存性理論與關鍵技術研究》是依託華中科技大學,由鄒德清擔任項目負責人的面上項目。
基本介紹
- 中文名:基於容錯代價的雲計算可生存性理論與關鍵技術研究
- 項目類別:面上項目
- 項目負責人:鄒德清
- 依託單位:華中科技大學
中文摘要,結題摘要,
中文摘要
雲計算在為租戶提供方便易用和低成本服務的同時,其多租戶、資源高度集中特性使得系統一旦出現故障所造成的損失遠比傳統計算模式嚴重。雲計算的可生存性體現在兩個方面:(1)對租戶而言,需要提供一種滿足其服務質量需求,且付出代價小的容錯方案,並體現租戶分等級特徵,這也是以服務質量為本的雲計算追求的目標,是雲計算得以生存和發展的一大關鍵;(2)對雲平台而言,需要消除動態複雜環境下故障的關聯性以隔離故障和縮小其危害範圍,並儘可能減小容錯開銷,實現故障檢測和恢復的自動化,體現出平台的自修復能力。擬從三個層面開展研究:(1)故障複雜性分析,以組件為粒度開展關聯性分析,並以此研究故障傳播問題,(2)可生存性理論研究,分別從平台和租戶的角度研究平台的可生存性建模以及面向租戶等級的容錯代價理論;(3)可生存性關鍵技術研究,包括多層次、低代價容錯架構以及故障自動識別和恢複方法。項目成果將用於指導高可靠雲計算平台的設計。
結題摘要
雲計算在為租戶提供方便易用且低成本的服務時,由於其多租戶、資源高度集中等特性使得系統一旦出現故障所造成的損失遠比傳統計算模式嚴重,故項目從容錯代價著手,開展高效的可生存性理論和技術研究。研究內容主要包括:(1)故障診斷與分析:提出面向全系統日誌的、基於時間的故障關聯分析方法,通過故障關鍵字矩陣,有效地對故障日誌進行實時分類;並改進了傳統的故障關聯性分析,利用日誌故障分類的結果來確定不同時間視窗的大小,提高了故障關聯性分析的準確率。新故障日誌分類方法,可以對95%以上的日誌進行自動分類,關聯分析的錯誤率為20%左右;(2)軟體更新理論與方法,包括離線更新和線上更新兩類,針對離線更新,提出了面向IaaS的軟體更新即服務機制,該機制具有較高的軟體信息採集效率,同時能在軟體支持率100%的情況下,完成對鏡像的離線更新;並能高效地驗證鏡像更新後的可靠性。針對線上更新,提出了面向雲計算的動態軟體升級機制Replus,Replus可以動態地更新C程式,且非常適用於雲平台,同時占用的記憶體空間更小,對軟體性能的影響可忽略不計;(3)故障容忍和故障容錯,提出了軟體記憶體錯誤的動態容忍機制,實現了對C/C++程式棧緩衝區的錯誤和堆緩衝區的錯誤的主動容忍,能有效地預防因記憶體錯誤而終止服務、產生未定義的程式行為或黑客攻擊等情況;針對故障容錯,提出了面向雲計算的輕量級軟體容錯系統,利用雲環境下軟體故障容忍機制解決了容錯效率問題;利用軟體記憶體故障按需容忍機制解決了容錯正確性問題;利用軟體棧溢出漏洞修復機制解決了棧溢出漏洞修復問題;利用動態軟體升級機制解決了補丁動態套用難題;(4)故障自動修復,提出了基於訪存虛擬化的棧溢出漏洞修復機制,在SafeStack系統鑑別出引發故障的棧緩衝區後,由訪存虛擬化機制將該緩衝區從棧中移到受保護的記憶體區,而後生成漏洞補丁暫時修復該漏洞,使軟體免於後續相同的攻擊。本項目從可生存性全周期提出了相應核心技術和方法。