人工智慧算力網路將各地分布的人工智慧計算中心節點聯接起來,構成多個計算中心間感知、分配、調度人工智慧算力的網路
人工智慧算力網路將各地分布的人工智慧計算中心節點聯接起來,構成多個計算中心間感知、分配、調度人工智慧算力的網路,在此基礎上匯聚和共享算力、數據、大模型等算法資源,是人工智慧計算中心進一步發展的重要方向,將有助於推動構建區域範圍乃至全國範圍的人工智慧產業生態網路。
基本介紹
- 中文名:人工智慧算力網路
- 釋義:構成多個計算中心間感知、分配、調度人工智慧算力的網路
建設背景,網路架構,網路作用,
建設背景
超大規模預訓練模型得到長足發展和廣泛關注,以大數據和大算力優勢取代了一些小的算法模型,“大模型+大數據+大算力”成為邁向通用人工智慧的一條可行路徑。
人工智慧科技和產業開始步入全面融合發展的新階段,在本地便捷部署異地人工智慧計算中心的超大規模預訓練模型,促進行業套用的流動,並實現基於網路的快速疊代,對人工智慧計算中心提出新的需求。
同時,在國家碳達峰、碳中和的大戰略背景下,除統籌建設低PUE(Power Usage Effectiveness,能耗利用率,越低代表能耗越充分被利用)的人工智慧計算中心之外,需要人工智慧計算中心進一步提升總能耗利用率,實現各地算力的削峰填谷,降低因計算業務天然存在波動而造成的能耗閒置,以應對人工智慧自身發展所帶來的計算中心規模總量與能耗總量不斷增長的事實。
以上新形勢迫切需要在加強人工智慧計算中心建設的過程中,不僅僅將計算中心作為獨立的系統發揮作用,而是逐步形成相互聯接的人工智慧算力網路,以滿足網路化算力聯通調度,大模型通過網路部署並結合不同區域產業優勢套用落地,數據集、行業套用等人工智慧要素能夠藉助網路平台便捷流動共享的需求
網路架構
人工智慧算力網路的實現架構包含算網一體基礎設施、統一運營多維調度管理、大規模分散式多方協同計算三個平面。
算網一體基礎設施:在基礎設施平面,計算和網路融合協同,構築人工智慧計算的一體
化基礎底座。計算設施基於新型計算架構、晶片技術、系統軟體、套用軟體等全棧整體建設,在低能耗的基礎上輸出高性能有效算力;網路互聯設施基於新型網路技術實現區域內多計算中心互聯以及跨區域長距離互聯,具備以下特點:網路訪問智慧型接入、網路流量智慧型最佳化、網路健康智慧型監測、網路安全智慧型防護。
統一運營多維調度管理:人工智慧算力網路管理平面由調度平台和運營平台組成。算力網路調度平台是整個算力網路的核心,基於對算力、網路的感知信息進行人工智慧計算作業的調度。在算力網路的運行過程中可以根據需要選擇一種或多種調度策略:能耗感知、負載感知、套用感知、質量感知、智慧型選路。算力網路運營平台可實現對多個人工智慧計算中心的統一運營,主要內容包括:套用/模型/數據市場、全局算力視圖、統一賬戶認證和授權、統一計量計費、統一運維分析等。
大規模分散式多方協同計算:在協同計算平面,通過人工智慧算力網路使能算法、數據、算力、模型和服務,在市場上安全、合規、自由的流通共享,進而實現全新計算範式和業務場景,如大規模跨地域異步訓練、聯邦學習、多方協同計算等
網路作用
人工智慧算力網路的作用與價值可以概括為“一網路三匯聚”,即一張人工智慧算力網路,匯聚算力、數據和生態,打造人工智慧產業聚集效應,奠定中國實現人工智慧產業全球領先的基座。
一張算力網路:將不同人工智慧計算中心節點連成一張人工智慧算力網路,算力網路吸納和調度全國人工智慧計算中心算力,以統一服務的方式,輸送高可靠、可度量、通用化的算力、算法、算據資源,使能人工智慧套用。
算力匯聚:不同人工智慧計算中心之間高速網路互聯,實現算力合理調度,資源彈性分配,提升各個人工智慧計算中心的利用率,為大模型訓練提供超級算力,還可實現整體能耗的節省。
數據匯聚: 多方合作,推進AI領域的公共數據開放,基於人工智慧計算中心匯聚高質量的開源開放的AI數據集,促進AI算法開發和行業落地。
生態匯聚:採用互聯、套用接口等標準,實現網路內大模型能力開放與套用創新成果共享,強化跨區域科研和產業協作,為所有用戶進行AI套用創新提供更多的資源選擇和更便捷的合作方式,加速產業聚合,激活產業共融共生。