簡介
曙光5000A已經有了響亮的名字——“魔方”。上海超級計算中心有關負責人表示,曙光5000A投入套用後,將為
氣象、
海底隧道、環保、
船舶、大飛機製造、汽車、建築、鋼鐵、石油、機電、高校、科學院等領域提供強有力的計算服務,為城市減災防震提供安全保障。
除了擁有超強計算能力外,曙光5000A還擁有全自主、超高密度、超高性價比、超低功耗以及超廣泛套用等特點,同時在體積、節能、軟體效率和可管理性方面都會有很大幅度的提高,它的性能將會是曙光4000A的20倍,體積卻只有三分之二,耗電只增加了50%。
2008年9月16日,曙光5000A在曙光天津產業基地正式下線,這標誌著中國成為繼美國後世界上第二個自主設計並製造百萬億次高性能計算機的國家。
曙光5000A即將被安裝在上海超級計算中心。多年來,作為
公共服務平台,超算中心的用戶均是科學研究、工業工程、教育等領域自主研發創新的排頭兵。平台支持了一大批國家和地方政府的重大科學研究、工程和企業新產品研發,包括在研的大飛機項目、即將試飛的支線飛機、載人航天二期工程、東方紅四號通信衛星、數字黃河、百萬千瓦核電站自主研發項目、滬崇蘇隧道、上海光源等,產生了包括國家科技進步一等獎在內的一大批科研獎項。目前,超算中心的用戶已經遍及全國27個省市。“魔方”的引進,將不但緩解當前計算資源供需矛盾,而且將能為更多的自主創新的用戶和國家新啟動的新一輪重大科學研究和工程建設項目提供強大的支撐平台。
性能
(1)突破230萬億次峰值運算能力
曙光5000A採用國際高性能計算機主流的機群結構,整個系統規模達到1650個節點,每個節點為4CPU的4核SMP系統,採用AMD Barcelona 2.0GHz處理器,峰值運算速度為230TFLOPS。整個系統通過兩套網路互連,包括Infiniband、千兆乙太網。系統的主要配置如下:
230T FLOPS峰值運算速度
6600個CPU
1650個結點
100TB記憶體
700TB存儲
兩套網際網路
曙光Gridview機群軟體
(2)高密度
對於大規模高性能計算機系統而言,如何提高系統密度並降低功耗是研製人員面臨的關鍵問題之一。為提高曙光5000A的系統密度,中科院計算所聯合曙光公司,研製了具有自主智慧財產權的4CPU 4核高密度刀片主機板和基於該主機板的世界上第一款7U高度的10片4路4核64位CPU的工業標準刀片伺服器。該刀片伺服器可以實現單機箱40CPU,160核的超高計算密度,並實現了單節點內部的並行計算。
(3)全自主
中科院計算所聯合曙光公司自主設計了包括主機板,體系結構,刀片伺服器,刀片機箱系統,網路交換系統,水冷散熱系統在內的全部系統。曙光5000A的設計也完全符合中國刀片伺服器標準。在自主創新的研製過程中,曙光在業界實現多個第一:
首次實現了4路16和的高密度刀片系統,
首次實現了單刀片機箱40克CPU的高密度機箱設計,
首次實現了基於DDR的Infiniband的交換結構,實現了20GB高速互聯和小於1.3us的低延遲。
首次採用了水冷散熱系統,降低了高性能計算機對機房系統的要求,降低了系統功耗。
(4)高效能
由於採用高密度伺服器,曙光5000A能大約75平方米的占地面積內聚集230萬億次的計算能力,而其滿負載運行時不帶水冷系統功耗只有700千瓦,代水冷系統的功耗僅為1000千瓦。這一方面提高了機群系統的可擴展性,另一方面降低了整個系統地運行成本。
(5)高速互聯
</strong>曙光5000A採用基於DDR的 Infiniband高速網路實現計算網路和存儲網路合一。實現了20GB的節點間傳輸速度,實現業界最快的小於1.3us延時。
(6)套用廣泛
</strong>曙光5000A不僅可以套用於高性能計算,還可以套用於信息服務,電子政務,網路遊戲等常見商業套用。
在高性能計算領域,曙光5000A可廣泛運行證券指數計算、電力安全評估、建築工程抗震性評估、天氣預報、石油地震資料處理、核能開發利用、汽車碰撞、電磁輻射、計算流體力學、基因匹配與拼接、蛋白質結構分析和材料科學等20多個套用領域。
在商業套用方面,由於曙光5000A使用Suse Linux 和 WCCS ,可廣泛運行目前Linux和Windows下的主流的行業軟體
(7)節能
曙光積極回響世界環保組織節能減排得號召,在曙光5000A中採用了多項節能措施,使曙光5000A在滿負載運行時不帶水冷系統功耗僅700千瓦,帶水冷系統的功耗僅為1000千瓦。
採用了低功耗的CPU,每年節電55萬度
採用了低功耗的記憶體,每年節電5萬度
採用了刀片結構,電源效率最佳化,每年節電100萬度
採用了水冷散熱體系,每年節電200萬度
採用了曙光自主研發的自適應功耗管理軟體, 每年節電200萬度
(8)高效冷卻系統
曙光5000A首次採用了水冷系統,通過使用水冷系統,降低了高性能計算系統對客戶機房的要求,同時提高了冷卻效率。水冷系統的設計實現了水電分離,保證了系統的安全性。同時水冷系統還包括備份的被動散熱系統,可以在水冷失效的情況下保證系統的正常運行,提高了系統的穩定性。
(9)高性價比
通過選擇AMD Barcelona和自行研製的主機板,曙光5000A的價格優勢更是十分顯著,是新型信息化思路的產物,能大幅降低高性能計算機的成本,使曙光5000A具有很好的性能價格比。
在曙光5000A的研製過程中,曙光公司延續了以往艱苦奮鬥的精神,使得曙光5000A具有極高的性能價格比。實現230萬億次的計算速度的曙光5000A總造價約2億元。
(10)自主創新的管理軟體
在大型機研製過程中,曙光不僅追求最快,同時也在系統管理方面最求完美。曙光5000A中,曙光自主開發了Grid View集群管理管理系統。曙光新一代Gridview大型機綜合管理系統提供統一的集中式監控平台,具備可擴展性、集成性、可靠性和易用性,提供對各種商用、自己研發的管理工具的集成接口,包括直接以Portal的方式集成和抽取各已有管理工具的監控數據以便上層平台能夠分析利用,從而滿足同時對分散式廣域\區域網路高效能百萬億次可擴展計算機的環境、硬體、軟體等各方面進行監控的需求。曙光Gridview大型機綜合管理系統具有高可靠性,具有一定容錯性和健壯性,使得當部署運行環境等發生異常時系統能夠運行在可控的範圍內,並進行準確的異常定位提示。系統具有易用性,提供簡單靈活的系統部署,人性化的界面和功能設計,方便最終用戶的使用,包括靈活方便的個性化設定、多樣的內容展現形式。管理系統同時提供個性化、自定義報表輸出功能。曙光新一代GridView可有效解決大型機管理的複雜性問題,保障了管理的擴展性、可靠性、自主性和貼近套用需求。
Grid View管理系統不僅適用於曙光5000大型群集系統,也是用於全系列的曙光伺服器
(11)與國際廠商AMD、微軟戰略合作意義重大
通過曙光5000A項目,計算所、曙光公司與AMD公司進一步加強了戰略合作關係。採用AMD Barcelona處理器,使中國用戶能更早地、更廉價地、更容易地得到64位計算能力;同時引入充分競爭,為中國用戶帶來更多的技術選擇,更大的價格利益,並從國家利益的高度有利於改善中國計算機產業的格局。
地位影響
曙光5000A是國家863計畫重大項目“高效能計算機及格線服務環境”的核心項目之一,由科技部和上海市政府共同資助研製。經過一年多的研製,於2008年9月在天津成功下線,11月在北京完成性能測試。
曙光5000A是目前國內研製生產最快的超級計算機。上海超級計算中心此次參與研製和即將部署的這台機器,是目前超算中心計算能力的20倍。該系統採用全球著名微處理器廠商AMD公司生產的“巴塞隆納”4核晶片、4路刀片系統、8路機架式節點和Infiniband高速互聯的體系架構,採用了單個機櫃40顆CPU、160個核的高密度機箱設計,具有高性能、高效能、高密度的特點;同時採用了低功耗的處理器和記憶體,先進的水冷散熱系統和刀片架構,有效控制了耗電量。
TOP500是世界最強超級計算機排名的簡稱,這個排行榜自1993年設立,每年6月、11月兩次統計發布世界上最強大的500個計算機系統。
套用前景
上海超級計算中心副主任袁俊說,超級計算機不是想像中那般“高高在上”,並非只能用於頂尖研究和超級工程。隨著排名世界第十的超級電腦“魔方”在上海“開張”的日子不斷臨近,上海超算中心正盤算著更多的“平民化套用”,為中小企業和轉型中的傳統製造業提供研發支撐。
上海超算的運算能力是每秒10萬億次,現有的“曙光4000A”4年前也曾入選世界前十,但時過境遷,老機器的能力已經飽和,想上機的科研機構和企業必須排隊。袁俊介紹,超算中心一般會優先滿足基礎研究和重大工程的需求,從演算宇宙變化到支持大飛機開發,高端套用占了80%以上,眼下確實無力為更多普通企業騰出計算資源。
但情況就要改觀——由科技部和上海市政府投資,即將於明年上線的超級計算機“魔方”,計算能力比現在提升20倍,達到每秒200萬億次,這給超算的“平民化套用”提供了可能。
不過即使現在,超級計算機離一般企業實際上也並不遙遠。袁俊找出一份上海超算的“客戶清單”,其中已有一些中小型企業和研究機構的名字,以汽車行業的居多。
“圍繞一些大型整車廠,有一批小型企業為他們提供研發服務。”中小企業不是搞汽車外形設計,而從事發動機、減震器、變速箱等重要組件的開發和試驗。藉助超級計算機,小企業能省下許多成本:在“虛擬世界”中“製造”部件並“試驗”,本身就便宜;而通過上海超算的公共服務模式,小企業無需投資購置計算機軟硬體,只需租用CPU晶片,按使用時間付少量費用。
汽車業對超級計算機的熱衷,反映出一個趨勢——隨著產業鏈分工日趨精細化,越來越多的研發流程被大企業向外分包,落向中小企業。這些企業人員精簡,由少量高層次技術核心人物領銜,資金實力不強,十分需要上海超算這樣的公共服務平台。
在研發外包和研發機構小型化的趨勢下,未來最先成為“平民化超算用戶”的可能來自製藥領域,計算機能幫助企業篩選有用的化合物。
此外,在全球經濟金融危機的背景下,國內一些原先位於產業鏈低端的製造企業,有潛力、也有動力藉助技術升級向高端轉型。此前,上海超算曾意外地接待過幾家“平民用戶”,有國內的開關廠和水泵廠主動上門要求上海超算幫忙“動腦”,它們在研究高級電氣設備的電磁分布,和高效率水泵的流體設計。
2010年與“魔方”一起上線的,還包括一套“傻瓜式”軟體,它可幫缺乏經驗的“平民用戶”迅速上手。而通過網際網路,上海超算已經可以為全國各地的企業提供遠程服務。
國外超級計算中心幾乎全都是為某些特定企業或機構服務的;由政府投資、採取公共服務模式運營的,上海超算幾乎是唯一一家。袁俊表示,全球的不景氣局面,使得中國對海外高端研發人才的吸引力不斷加大,他們來華後,更傾向於創辦獨立於大企業的研發外包機構,這些人對超級計算機很熟悉。如果這樣一個中小型研發企業群形成氣候,不僅上海超算能獲得更良性的產業生態,更可望提升上海的自主創新能力、加快現代服務業發育成長。