一雲多芯

“一雲多芯”是指使用一套雲平台管理不同晶片架構的計算資源,實現異構資源的統一管理和調度,並通過雲平台禁止底層架構差異,為用戶提供體驗一致的雲計算服務。隨著企業數位化轉型和套用創新不斷加速,“一雲多芯”的內涵也在不斷延展,不僅僅是指對不同CPU架構資源的管理,同時還包括GPU、FPGA、DPU等算力的管理;“一雲多芯”已經成為IT產業鏈承上啟下的關鍵紐帶,除了對下管理調度異構硬體資源,提供虛擬機、裸機、容器,還要融合多種作業系統、中間件、資料庫、AI等服務,為上層各行業的創新套用提供穩定的運行環境以及豐富的的生態服務。

2023年7月,入選2023雲計算十大關鍵字。

產業背景,必要性,技術路徑,產業實踐,參考基準,產業標準,

產業背景

近年來,從晶片、整機、作業系統、雲平台、中間件到套用軟體等技術領域的創新鏈、產業鏈已初步形成,以X86、ARM、Power等不同架構處理器的為基礎的產業生態框架已基本就緒。國內IT產業生態也隨著新一代技術套用場景不斷拓展,已經形成了多技術路線全棧式支撐能力。在數據中心建設方面,隨著企業“上雲用數賦智”的不斷加速和深化,新場景下的算力孤島問題逐漸凸顯。如何實現多種晶片技術路線的高效協同,以套用為導向、從系統設計視角出發,滿足多芯共存、多雲異構條件下的雲原生環境構建,保障業務套用的穩定運行、平滑切換和線性增長,成為新一代雲數據中心架構體系需要攻克的新的挑戰。

必要性

雲計算是協同紐帶,“一雲多芯”是關鍵。
“一雲多芯”是打破小生態、構建大生態的關鍵紐帶。
信息技術產業鏈發展迅速,相關技術及產品已開始大規模套用於金融、通信、政府等關鍵行業。但從產業鏈協同上看,各環節垂直封閉、生態離散,多個小生態並行存在。自有封閉小生態的排他性不利於產業的健康發展,難以形成產業合力,同時又給行業用戶在技術選型上帶來困擾。如何打破小生態壁壘,避免因技術選型失誤帶來的業務轉型失敗是各個行業關心的話題。在我們看來,“一雲多芯”無疑是個最佳選擇。同時,其在一定程度上激發了IT產業鏈上下游的創新活力,進而促進整體生態的協同發展。
“一雲多芯”可滿足用戶算力多樣化需求,並且可有效規避算力孤島。
隨著各行各業業務創新的爆發式增長,不同業務場景對算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉移。為充分發揮多元異構(不同架構、不同種類)晶片的能力優勢,金融、能源等關鍵行業應基於多種晶片架構來構建雲基礎設施底座,實現多元算力的統一池化管理、統一調度以及業務的差異化部署等,逐步實現從算力並存到算力統一。
“一雲多芯”可有效降低供應鏈風險。
“一雲多芯”是IT產業鏈承上啟下的關鍵環節,具備對下納管底層各種晶片,禁止底層基礎設施異構晶片差異,對上提供開放、統一的算力接口。但是,目前在雲計算產業中,各伺服器晶片的表現參差不一,導致用戶體驗難以一致,套用效果也大相逕庭。用好“一雲多芯”,可以最大程度的降低技術路線的選擇風險,極大提升業務穩定性以及業務改造的靈活性。
由此可見,無論是從業務角度、技術角度,還是產業鏈角度,踐行“一雲多芯“已經成為當下及未來雲計算產業發展的關鍵,是產業鏈相關廠商的必然選擇。

技術路徑

一雲多芯的最終目標是支撐用戶業務在不同架構處理器之間的低成本切換或者自由切換。因此,基於以系統設計為核心的思維,採用以場景驅動的“硬體重構+軟體定義”的融合架構,是數據中心體系結構的發展方向。認為可以分“有-好-優”三步走來實現一雲多芯的中長期目標。
“一雲多芯”在雲計算步新中已經成為業內共識。雖然“一雲多芯”目標明確,但在產業落地過程中仍存在多方面挑戰。
首先是理念的轉變。IT基礎架構經過長期的發展,從大機、小機時代逐步演進到雲計算時代,開放計算深入人心。但直至今日,晶片指令集、作業系統架構上的差異化依然制約著架構的橫向協同,比如一個套用需要同時適配多個指令集和作業系統的問題仍然很嚴重。IT產業需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉變為以系統為核心的設計,以“以套用為導向,以系統為核心”構建新一代產業生態。“一雲多芯”是就是這種理念的具體體現。
其次是缺乏統一的“一雲多芯”建設標準、規範。算力標準化是產業的願景,因此基於”一雲多芯”打造的算力平台需要標準化、統一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同晶片架構資源池的這種模式也包裝成“一雲多芯”,由於無法實現真正的互聯互通,對業務的連續性造成很大的風險。
一雲多芯
發展層次
第一階段,混合部署、統一管理、統一視圖
第一階段解決“有”的問題。以云為入口,通過雲作業系統實現異構處理器伺服器的統一管理,覆蓋國內外主流處理器,提供統一操作界面、操作方式及統一監控運維等,解決雲資源池只能承載單一廠商或單一架構處理器的伺服器而導致的套用無法跨架構部署、協同的問題。
第二階段,業務牽引、分層解耦、架構升級
第二階段解決“好”的問題。在第一階段的基礎上,進一步實現套用的低成本跨架構切換。通過資源層、平台層和套用層的“分層解耦”設計,實現架構升級。
在資源層面,通過跨平台的遷移實現套用跨架構快速部署。
在平台層面,實現平台套用的跨架構混合部署,如資料庫集群在一雲多芯平台上實現跨架構的狀態同步、數據同步,實現了多實例在不同處理器架構的伺服器上的並行運行。
在套用層面,可通過服務格線等技術實現套用的跨架構流量切分。
第三階段,算力標準、全棧多芯、生態共建
這個階段是解決“優”的問題。從業務連續性的維度,認為”一雲多芯”的終極目標是實現套用與晶片架構的徹底解耦。這需要硬體、雲以及套用等產業鏈上下游的共同協同,完善異構架構下有效算力的量化方法,以支持套用在不同架構處理器間的等價切換。共同推動套用與雲基礎設施的一雲多芯相結合,打造垂直一體化方案,實現套用層面的跨架構無感知切換。在標準和測評方面,聯合專業軟體測評機構及產業鏈上下游生態,形成一雲多芯行業標準。

產業實踐

“一雲多芯”已經不再是一個簡單的口號,而是構建我國IT產業新生態的關鍵路徑。浪潮信息參編的基礎設施雲管理軟體、虛擬化雲平台和容器平台等多個國家級、行業級標準,也是以分層解耦、生態共建的理念推進我國信息產業健康有序發展。同樣,中國人民銀行印發的金融科技發展規劃中,也對金融行業“一雲多芯”的發展以及相關金融雲平台套用標準提出了明確的目標及要求。浪潮信息配合某國有大型銀行進行了“一雲多芯”的實踐,採用多種晶片伺服器和雲海OS,完成了核心MPP數倉產品的認證測試並實現大規模生產系統套用。同時,針對大數據、訊息中心、快取系統等核心業務平台也全面開展了合作。浪潮信息參與建設的多個行業雲平台,在支持一雲多芯的基礎上,遠程跨域管理、集群規模及線性擴展能力同樣達到業界領先水平,單資源池規模超過1000節點並可按控制器實現線性擴展,支撐了金融、能源、交通等行業雲數智多樣化業務需求。

參考基準

2023年1月,浪潮雲海OS完成業界首個面向一雲多芯場景的SPEC Cloud基準測試,在三種處理器節點混合部署集群測試中,相對可擴展性、平均實例配置時間等指標均達到全球領先水平,驗證了雲海OS在業務套用跨處理器架構場景下的高效率、高性能和高擴展能力。雲海OS在成功完成全球最大規模單一集群雲數智融合實踐,建立“大規模雲集群參考設計規範”後,又一次引領私有雲發展趨勢,建立了以“一雲多芯”為核心的雲平台參考基準。
一雲多芯
SPEC Cloud IaaS 2018
SPEC是由全球幾十所知名大學、研究機構、IT企業組成的第三方測試組織,擁有SPEC CPU、SPEC Power、SPEC Cloud、SPEC ML等多項公開的標準化測試規範和模型。其中,SPEC Cloud IaaS 2018(以下簡稱SPEC Cloud)作為權威的雲計算性能基準測試,在綜合性能、可擴展性和實例部署時間等方面綜合評估雲平台性能,是目前全球最受企業級客戶認可的IaaS雲性能評估基準。
SPEC Cloud通過YCSB和K-Means兩類實例,分別模擬公有雲、私有雲、混合雲等多種雲場景下的IO密集型和計算密集型工作負載,從而驗證雲平台的綜合性能、可擴展性。其中,YCSB任務構建Cassandra實例模擬標準社交媒體NoSQL資料庫套用場景,其測試項包括吞吐量、資料庫插入、讀取回響時間、套用實例配置時間;K-Means任務通過大數據基準測試工具HiBench構建多個實例進行K-Means算法測試,其測試項包括完成時間、實例運行的Hadoop疊代計數、套用實例配置時間。整個測試過程通過不斷增加負載壓力,來評估雲平台的數據面性能、可擴展性以及控制面性能。
在SPEC Cloud測試中,浪潮雲海在x86+ARM混合處理器架構集群上部署了雲平台,取得多項指標媲美甚至超出單一晶片架構集群的性能表現。其中,在平均實例部署時間上,雲海OS實現了SPEC Cloud IaaS 2018雲基準測試的最佳數值31秒,超出原紀錄25%,展現出在控制面的高效穩定調度與並發能力、資源實例的快速拉起與回響能力;在相對可擴展性方面,雲海OS也達到接近線性的90%以上,說明在一雲多芯場景下業務負載可以有效彈性擴展;在性能得分上,雲海OS在一雲多芯場景下的性能得分超過SLA基線20%
此次SPEC Cloud結果表明,雲海OS在一雲多芯場景下具備高效率、高性能和高擴展性,可實現跨架構資源池混合部署、架構感知適應性調度、套用負載實例快速配置與創建、高並發與負載均衡等,能夠有效幫助企業級用戶完成一雲多芯資源統一管理、負載均衡調度、套用高效穩定運行和業務彈性擴展。
浪潮雲海OS是向雲計算數據中心、智慧型計算數據中心等新型數位化基礎設施的雲作業系統,通過軟體定義一切,將多元計算、不同存儲介質和複雜網路架構統一的虛擬化,形成動態的資源池,同時具有完善的微服務化控制界面,可自動化的彈性資源調度和自適應編排,實現資源的高效流動,幫助各行業實現業務雲化轉型。
浪潮雲海OS服務全球10000+客戶,擁有超過500+技術、方案和服務合作夥伴,OpenStack社區貢獻位列全球TOP級別,雲海OS團隊憑藉著硬核的技術實力,不斷提高和最佳化產品特性,為越來越多的客戶和合作夥伴帶來高效的平台和服務。

產業標準

近年來,國家出台的相關政策加速了一雲多芯發展。2021 年 3 月,《“十四五”規劃和2035 年遠景目標綱要》發布,提出加強通用處理器、雲計算系統和軟體核心技術一體化研專;2022 年 10 月黨的二十大報告強調,要加快建設製造強國、質量強國、航天強國、交通強國、網路強國、數字中國。加快實施創新驅動發展戰略,加快實現高水平科技自立自強。023 年 2 月,國務院發布《數字中國建設整體布局規劃》 側重強調了建設數字中國對推進中國式現代化的重要性,明確應通過夯實數字基礎設施和數據資源體系“兩大基礎”來建設數字中國。
在此背景下,為回響國家政策要求以 及行業用,戶需求,一雲多芯規範化、高質量的發展目標,中國信通院聯合浪潮雲海、阿里雲等數十家行業龍頭企業共同制定《一雲多芯技術能力標準體系》。這是業界首個一雲多芯標準,從多個維度規範產品和解決方案的技術要求,為用戶採納”一雲多芯“雲產品提供參考指導。更重要的是,統一的標準體系,將有助於解決不同類型晶片共存所帶來的多雲管理挑戰,真正形成企業內部一朵雲。
在首批參與一雲多芯IaaS能力評估的眾多產品中,浪潮雲海OS在兼容能力、基礎服務能力、運維運營管理、高可用、平台安全等各個維度均取得優異成績,最終獲得最高等級“先進級”評估認證。首批評估結果也圈定了一雲多芯產品和服務商第一梯隊,成為用戶採購選型私有雲的風向標。

相關詞條

熱門詞條

聯絡我們