浪潮天梭M13

2016年12月,浪潮在北京發布了新一代關鍵套用主機天梭M13。

這是我國自主研製的線上交易處理性能最強的單機伺服器系統,面向對穩定性和可用性極高的銀行、政府、大企業的超大型資料庫套用設計,具備大型機水平的RAS特性以及比肩大型機的處理性能,具備承載大型機套用的能力。該系統是繼成功研發天梭K1主機並獲國家科技進步一等獎之後,浪潮在高端伺服器領域又一重大技術突破。

2018年12月9日,浪潮電子信息產業股份有限公司“浪潮天梭M13關鍵套用主機項目”榮獲第五屆中國工業大獎表彰獎。

簡介,研發歷程,特性介紹,系統層面——全冗餘設計以及SFDP,SFDP一體化智慧型診斷系統,多層面體系化冗餘設計,IMD智慧型記憶體保護,套用層面——隔離單點故障,容災——隔離數據中心災害,套用場景,生態建設,

簡介

天梭M13是新一代關鍵套用主機,性能比肩大機,可承載大機套用。這是迄今為止,我國自主研製的線上交易處理性能最強的單機伺服器系統。
天梭M13面向對穩定性和可用性極高的銀行、政府、大企業的超大型資料庫套用設計,具備大型機水平的RAS特性以及比肩大型機的處理性能,具備承載大型機套用的能力。
天梭M13是繼成功研發天梭K1主機並獲國家科技進步一等獎之後,在高端伺服器領域又一重大技術突破。
天梭M13可擴展1000個以上計算核心,48TB記憶體,單日可處理交易量數十億筆。而且,天梭M13提供基於套用的最佳化器,最佳化器支持國內外主流的資料庫和套用平台,可以詳細感知客戶的套用場景的差異性和特點,自動向用戶推薦硬體層和作業系統層的專家核心參數模板,用戶可以根據業務需求靈活選擇,讓整體套用系統發揮出最好的性能表現。

研發歷程

2002年 發布“天梭工程”,正式進入高端市場
2004年 浪潮天梭打破並刷新TPC-H世界紀錄
2007年“高效能伺服器和存儲技術國家重點實驗室”落戶浪潮
2010年 中國第一台關鍵套用主機天梭K1研發成功
2013年“國產主機系統產業聯盟”成立
2014年 啟動“K遷工程”
2015年 天梭K1榮獲國家科技進步一等獎
2015年 發布K-DB 企業級關鍵業務資料庫系統
2016年 天梭M13新一代關鍵套用主機正式上市

特性介紹

浪潮天梭M13系統是支持高達48TB記憶體容量的千核級新一代關鍵套用主機,擁有單日處理數十億筆交易的強大計算能力,為客戶核心業務量身打造。
1、多層級RAS特性保障客戶關鍵核心業務7x24不間斷運行
自頂向下的多層級RAS設計方案和系統故障自動檢測、預警和修復機制保障了業務的不間斷運行。M13從鏈路、部件到系統提供全方位故障診斷和自動糾錯功能,消除了意外停機威脅。SFDP一體化智慧型診斷系統,通過多維故障感知、智慧型故障診斷、自動故障隔離、快速故障恢復,實現對軟硬體故障的高度統一管理,將宕機的風險降到最低。
多層級RAS特性設計是一個自頂向下的系統工程,浪潮在硬體、系統和套用等三個層面採用了整體性的高可用技術,使得天梭M13系統能夠提供7*24的業務連續性,能夠避免硬體故障、系統故障等各種情況對系統業務的影響。
K-UX專屬最佳化作業系統能實時捕獲底層故障信息,通過智慧型化判定模式確定最優解決方案,自動修復系統的軟性故障,自動禁止潛在問題部件,結合部件容錯特性保證系統對外服務的完整性,最大程度降低計畫外宕機風險。同時其在系統安全方面進行了專業增強,有效規避非法數據訪問。
2、多維虛擬化技術為客戶的混合負載提供彈性整合
M13系統支持多維度的虛擬化技術,提供統一管理平台,方便客戶根據自身業務需求進行靈活部署。
MHP硬體分區面向核心資料庫等關鍵套用場景,提供硬體級電氣隔離技術,確保資源直接調用。
MVP虛擬分區面向輕量級資料庫和中間件場景,實現多負載套用整合,有效提高主機利用率;資源池化技術提供資源動態調整、業務線上遷移、高可用部署等功能,支持超過3000個虛擬分區。
MDC動態容器面向多租戶模式和快速場景部署業務,提供更高效的部署效率,為多套用場景靈活地分配系統資源。
MPM統一管理平台為客戶提供統一管理平台,可實現對計算、存儲、網路、套用及虛擬、物理資源的監控管理,對外提供標準化開放的管理接口,可以便捷的接入數據中心管理平台。
3、面向多樣化套用,解決客戶基於套用的最佳化難題
浪潮基於多年對關鍵業務的研究,從保障客戶使用平台平滑性的角度出發,提供了從硬體層到軟體層的整體解決方案,內部專屬高速匯流排使M13擁有無與倫比的吞吐、處理能力,在軟體層為客戶提供了完整的開放體系和封閉體系下所需要的軟體組件包,使M13既支持大型國有銀行傳統大機平台所需的專屬中間件、編譯環境、批處理模組、集中式管理平台,也支持廣大股份制銀行和城商行的核心業務在開放架構部署模式下所需的絕大部分資料庫和中間件軟體。M13提供完善的系統遷移方案,從資源遷移、數據遷移、套用遷移、工具遷移等多個方面幫助客戶完成原有系統的切換工作。

系統層面——全冗餘設計以及SFDP

SFDP一體化智慧型診斷系統

浪潮為天梭M13開發了專門的全系統故障智慧型診斷預警系統(System Failover Diagnosis & Prediction,SFDP)。SFDP是一套軟硬一體化的故障處理系統,可以對多種事件源進行故障採集與檢測,如CPU、記憶體、網卡、PCIE、以及死鎖、XFS檔案系統,配置有可擴展的故障診斷引擎模組,包括機器學習關聯算法、故障預測、運行健康狀態分析,通過基於決策樹算法,支持多種容錯方式,並且支持以自學習的方式完善故障處理規則庫,包括快取刷新、暫存器禁用、物理隔離、CPU和記憶體熱插拔等,從而有效處理各類故障。
SFDP系統全面覆蓋了鏈路、部件和系統三個層面,能夠自行處理三個層面的各類故障,並可實現遠程報警。
  • 鏈路層面,天梭M13採用了連結級循環冗餘碼驗證,保證了信息傳遞的完整性和一致性。當信號在傳遞過程中出現失真等錯誤時,接收端就會發現驗證碼錯誤,讓信號重傳,當重傳達到一定次數後,系統就會認為該信號通道錯誤,將其標記為失效,將信號傳輸功能,並記入日誌,報警。
  • 部件層面,所有部件均為冗餘熱插拔設計,在SFDP系統的統一支持下,系統能夠及時偵測部件的異常、故障,並進行糾正或者隔離處理,當用戶更換故障部件後,系統會將新部件納入到系統中來。
  • 系統層面,K-UX有專門的故障管理中心,能夠自動記錄和分析各類故障,並自動學習和升級故障處理規則。

多層面體系化冗餘設計

天梭M13均採用了冗餘設計,當SFDP系統偵測到故障時,能夠有後備的資源進行替換。天梭M13支持核心級微碼的線上升級和自動回退,當一個控制器在升級失敗,SFDP就會啟用另外一個備用的控制器進行系統啟動,並將原控制器進行回退,重新升級,避免固件等底層代碼升級失敗對系統的影響。

IMD智慧型記憶體保護

記憶體錯誤和記憶體故障是引起系統停機的主要原因之一,目前通用伺服器的記憶體錯誤主要依靠ECC記憶體技術來處理(ErrorCheckingandCorrecting,錯誤檢查和糾正),記憶體硬體失效主要依靠記憶體鏡像和熱備來解決。天梭M13不僅包括以上技術,還採用了浪潮開發的另外一項技術,IMD(Intelligent Memory Defender)。IMD是SFDP系統的一部分首先,SFDP在系統開機時即對記憶體進行高強度的記憶體診斷,發現的錯誤單元將被禁止,不進入OS可用記憶體區域。其次,SFDP在系統運行過程中,會實時監測每個記憶體單元的工作狀態,對報錯單元及其相關的記憶體單元進行針對性檢測,結合獨有算法預測,若判斷有發生致命錯誤的趨勢,結合OS主動進行隔離,預防記憶體故障導致的系統錯誤,禁止後的記憶體單元/區塊根本不進入OS可用Memory,同時系統會根據所有的記憶體錯誤完善故障處理規則庫,實現自學習。

套用層面——隔離單點故障

天梭M13可以在套用層面組成多活緊耦合併行套用集群,最高支持16個節點,集群內部實現負載均衡以及1對1熱備,停機節點的任務會自動被熱備節點接管,因而任何一個甚至多個節點的故障,都不會影響業務運行。
集群的峰值I/O吞吐能力超過 4TB/S,足以應對任何突發峰值負載處理。而且,天梭M13還配置圖形化超大集群綜合調度及交易處理監控體系,管理員可動態監控交易實時負載。

容災——隔離數據中心災害

浪潮開發了基於天梭M13的異地雙活容災方案,可以實現“兩地三中心”,滿足超常距離套用和數據同步的需求。
浪潮雙活容災方案突出特點是可用性高,不會出現存儲壞塊導致資料庫可能打不開的問題。另外,該方案可以提供多種同步方式和保護方式,通常備用資料庫唯讀打開訪問,包括報告、查詢、排序、基於Web 的訪問等,這樣既可以保障生產庫的性能,又可以充分利用災備端資料庫資源,保障業務安全的同時,也最大限度的提高了設備利用率。

套用場景

天梭M13發布後,浪潮形成了完整的關鍵業務計算布局。形成了面向商業智慧型分析的天梭八路、HANA一體機;面向交易性關鍵套用的天梭K1;面向大型核心數據套用的天梭M13。
入門級產品天梭 TS860,該產品第一代在2010年就已推向市場,目前市場占有率穩定在40%以上,連續12個季度中國市場第一。主力產品天梭K1,可替代小型機,在2013年正式推向市場,在10-50萬美元Non-X86市場的份額達到25.3%。
天梭M13承擔的系統都是用戶的核心資料庫,基於天梭M13的各類套用解決方案必須經過嚴格測試、最佳化,一方面可以更好的防止技術風險,另一方面,經過整體最佳化,可以充分發掘解決方案的技術潛力,提升用戶價值和套用體驗。
同時,浪潮擁有AS18000高端存儲, K-DB資料庫,以及全系列的關鍵套用主機,是國內唯一一家具有軟硬一體化關鍵計算方案提供能力的企業。隨著天梭M13發布,浪潮的關鍵計算業務將重點轉向產品的完善和升級,轉向產業生態的建設和強化。

生態建設

目前,浪潮關鍵業務計算生態已經聚集了超過200家合作夥伴,已經覆蓋面向金融、財稅、社保等十二個行業場景的解決方案,已經形成了成熟的評估、計畫、驗證、測試和上線的五步遷移方法。建立了主機技術標準認證體系,已經有130種國內外基礎軟體、320多種ISV套用軟體通過了浪潮主機的技術認證,可以廣泛兼容DB2、Oracle、Sybase等資料庫、中間件和上層套用。

相關詞條

熱門詞條

聯絡我們