智算中心作業系統

智算中心作業系統旨在通過對智算中心基礎設施資源池的管理和調度對各類智慧計算套用進行支撐,從而實現雲數智融合及智慧服務的交付。

2020年11月25日,浪潮發布智算中心作業系統。

基本介紹

  • 中文名:智算中心作業系統
  • 發布時間:2020年11月25日
定義,由來,特徵,最佳落地,極致能力實踐,

定義

智算中心作業系統是智算中心的“中樞神經”,向下負責將物理設備真實算力轉化為資源服務,通過強大的管理和調度能力,向上對接各類基於數據智慧型的套用需求,最終實現以雲數智高度融合為代表的智慧計算服務。

由來

2020年4月9日,浪潮提出智算中心將成為智慧時代經濟社會運行所必須的重要基礎設施。
智算中心是智慧時代最主要的計算力生產中心,它以融合架構計算系統為平台,以數據為資源,能夠以強大算力驅動AI模型對數據進行深度加工,源源不斷產生各種智慧計算服務。
智算中心中,底層是融合架構的計算基礎設施,計算、存儲、網路融合在一起共同形成硬體的計算基礎設施。中間層是整個智算中心的“中樞神經”,就是智算中心作業系統,它向下負責將物理設備真實算力轉化為資源服務,通過強大的管理和調度能力,為上層各類套用提供支撐,最終交付智慧服務。
從IT基礎設施發展的視角來看,智算中心本身也是數據中心的一種高級形態。隨著社會智慧型化程度的加深,人工智慧計算成為計算的主要形態。2020年4月9日,浪潮提出“智算中心”;2020年4月20日,發改委明確提出“智慧型計算中心”的說法。智算中心或智慧型計算中心將成為未來AI計算的主要載體。 與基礎設施演進相匹配的是其管理系統軟體的發展,在智算時代管理系統需要對智算中心裡更大規模、更加複雜的資源,以及多元化的算力進行有效的智慧型調度與管理,向上對接滿足各類基於數據智慧型的套用需求,因此智算中心作業系統應運而生。

特徵

開放:IT的發展歷史,是不斷由封閉走向開放的歷史。隨著IT的發展,系統多樣複雜,硬體多元異構,需要開源技術加快複雜系統的開發速度,需要開放標準實現軟硬體的互聯互通。雲計算、大數據從開始就構建在開源技術的基礎之上,進入人工智慧時代,常用的人工智慧的框架和算法,基本都是開源的。通過開放的標準、開放的生態,構建開放的IT環境,整個IT產業才能不斷向前發展。
融合:智算中心有多元化的算力、多元化的套用、多元化的場景。這些算力、套用和場景融合在一個數據中心裡,需要智算中心作業系統來進行調度和管理實現可變粒度的資源池化及管理、雲數智套用的統一調度,滿足跨雲、容災、多雲及雲邊協同等需求。
敏捷:業務快速發展,前端高速變化的業務需求對後端的基礎設施提出了更高的要求,瀑布式研發、生產、標準化交付的模式已經不能夠滿足新趨勢下業務對IT的要求,需要以更敏捷的方式創造計算力,快速疊代、快速變更、快速上線、持續交付,為前端套用提供強大的源動力。
智慧型:智算中心包括生產算力、聚合算力、調度算力、釋放算力。在生產算力與聚合算力環節需要把各種智慧型加速設備充分利用起來,並且與數、智結合去調度、釋放算力,通過智慧型平台提供智慧型服務。同時也要結合AI技術提昇平台本身的運維與管理智慧型化程度,增強運維和管理能力。

最佳落地

2020年11月25日,在信通院、OIF、Globaldata、Forrester,Intel、百度及各行業用戶、媒體共同見證,浪潮發布“智算中心作業系統”。浪潮雲海OS作為浪潮在智算中心作業系統上的實踐,受到關注。
浪潮雲海OS以開源開放技術為基礎,以新時期用戶需求為出發點,不斷進化成為一個開放、融合、敏捷、智慧型的作業系統,滿足智算中心的需求,解決用戶面臨的挑戰。
● 極致開放:浪潮雲海以“OpenStack”和“Kubernetes”雙核驅動,通過對開源開放技術的攻堅,突破開源版本在性能、大規模管理能力方面的瓶頸;源於開源,饋於開源,在OpenStack社區開源了智慧型日誌管理項目“VENUS”,助力業界共同構建開放統一的智慧型基礎設施。
● 極致融合:雲海OS具備強大的融合能力,支持虛擬機、裸機、容器統一調度及混合編排的資源融合、跨域互聯互通互操作的多雲融合、一體化雲數智融合。通過融合實現對企業內部IT資源統一管理,為全場景業務提供統一支撐,提升資源使用效率,降低運維管理複雜度等。
● 極致敏捷:浪潮雲海在業務運營、安裝部署、擴容改配方面體現極致的敏捷性,助力業務快速疊代、持續交付。業務運營方面實現套用秒級上線、套用配置變更實時生效等,所見即所得,套用全生命周期極致高效;交付方面,基礎設施實現10分鐘全局參數最佳化調整、1小時單POD擴容,5分鐘組件升級等,從而進行快速的安裝部署和擴容改配。
● 極致智慧型:雲海OS融合AIStation人工智慧開發訓練推理平台、雲海Insight大數據平台,將資源、模型、數據統一管理起來,實現全流程數據管理、大規模數據訓練、智慧型推理等完善的智慧型算力調度、釋放服務;同時平台融入了AIOps能力,提高平台的可維護性,增強運維和管理能力。

極致能力實踐

2020年11月25日,浪潮雲海成功完成全球最大規模單一集群達1000節點的雲數智融合實踐。3天完成1000台伺服器部署,在單一集群中融合支撐了海量大數據處理業務及大規模雲原生業務,是一次雲數智融合測試,全面體現浪潮雲海OS作為智算中心作業系統的極致能力。中國信通院雲大所測評專家表示:“浪潮這次大規模測試,實現了三個方面的推動,為大規模IT基礎設施雲化建設提供了一定的保障,為行業雲數智融合建設提供現實的參考依據,為企業數智化轉型提供參考方案。”

相關詞條

熱門詞條

聯絡我們