Paramon軟體是由北京並行科技有限公司自主設計、研發完成的套用運行特徵收集器,設計目的是進行系統套用運行情況監控與分析,同時為系統調優收集數據。
基本介紹
- 中文名:Paramon套用運行特徵收集器
- 發明地址:北京
- 發明公司:並行科技有限公司
- 作用:監控與分析
產生背景,軟體介紹,軟體功能,軟體特點,部署環境,
產生背景
隨著計算機硬體的高速發展,多核處理器成為了主流,大規模並行機群、高性能機群和雲計算機群越來越普及。石油領域、氣象領域、航天領域、科研院所等用戶的計算規模不斷發展,因此,各領域用戶的硬體規模呈現爆炸性的增長。面對這一現狀,公司、企業或院校的用戶領導和硬體管理員很難對內部硬體環境的現狀和使用情況有一個直觀的了解。
隨著科學計算的不斷發展,各種計算軟體日趨成熟,可以模擬計算各種複雜模型,完成高解析度、高精度的計算分析;隨著計算機硬體的高速發展,多核處理器成為了主流,大規模並行機群也越來越普及。因此,基於目前的硬體環境,如何來提升套用軟體的運行速度成為很多客戶的迫切需求。而最佳化套用軟體運行速度的前提是獲取整個系統的主要性能參數,通過對這些參數的分析來完成套用軟體的最佳化。所以,如何來實時、準確、詳盡的獲得系統的主要性能參數成為完成最佳化工作的重點。
基於以上的一系列需求,Paramon/Paratune系列軟體問世了。
軟體介紹
Paramon軟體面向IT管理人員、硬體管理員、機房管理員等用戶角色,通過實時監控、採集機群中伺服器的CPU、GPU、記憶體、網路和存儲等關鍵設備的系統級和微架構級性能數據(Gflops、MemoryBandwidth、Vectorization、CPI、GIPS),以圖形化的方式直觀顯示,快速反映提供機群系統中套用軟體隨時間變化的運行特徵,同時了解硬體環境的運行現狀,快速了解機群中隱含的硬體問題,從而在問題發生時第一時間給出解決方案。
Paramon軟體按照功能分為四個版本,如下表所示:
序號 | 版本 | 說明 |
1 | ParamonBasicSingleNodeEdition | 單機基礎版,提供基礎數據和Gflops信息,通過並行科技網站可以申請下載。 |
2 | ParamonProfessionalSingleNodeEdition | 單機專業版,提供基礎數據和高級數據(包括Gflops信息),收費版本,通過購買獲得。 |
3 | ParamonBasicEdition | 機群基礎版,提供基礎數據和Gflops信息,通過聯繫並行科技銷售人員免費獲得。 |
4 | ParamonProfessionalEdition | 機群專業版,提供基礎數據和高級數據(包括Gflops信息),收費版本,通過購買獲得。 |
軟體功能
Paramon軟體不同版本所對應的功能如下表所示:
功能 | 單機基礎版 | 機群基礎版 | 單機專業版 | 機群專業版 | |
1 | 支持Linux | √ | √ | √ | √ |
2 | 支持Windows | 前台系統 | 前台系統 | ||
3 | 每秒鐘實時刷新 | √ | √ | √ | √ |
4 | 單結點顯示 | √ | √ | √ | √ |
5 | CPU系統級數據-CPUUSED | √ | √ | √ | √ |
6 | CPU系統級數據-CPUSYS | √ | √ | √ | √ |
7 | 記憶體利用率 | √ | √ | √ | √ |
8 | SWAP利用率 | √ | √ | √ | √ |
9 | 乙太網網路接收、傳送速率 | √ | √ | √ | √ |
10 | 磁碟讀寫速率 | √ | √ | √ | √ |
11 | 大規模機群(支持大於1000結點的機群環境,支持不同廠商的混合機群) | √ | √ | ||
12 | 遠程登錄管理 | √ | √ | ||
13 | 遠程命令管理 | √ | √ | ||
14 | 報警模組 | √ | |||
15 | 高速網際網路(Infiniband)模組 | √ | √ | ||
16 | NFS模組 | √ | √ | ||
17 | Gflops浮點計算性能 | √ | √ | √ | √ |
18 | 記憶體頻寬數據 | √ | √ | ||
19 | CPU微架構數據-CPI | √ | √ | ||
20 | CPU微架構數據-Vec | √ | √ | ||
21 | CPU微架構數據-GIPS | √ | √ | ||
22 | NVidiaCUDAGPU利用率 | √ | √ | ||
23 | 多網卡機器上每個網卡的數據 | √ | √ | ||
24 | SWAP-in/SWAP-out信息 | √ | √ | ||
25 | Intel-x86/Intel-x86_64 | √ | √ | √ | √ |
26 | AMD-x86/AMD-x86_64 | √ | √ | √ | √ |
Paramon軟體機群監控界面請見用戶案例部分。
Paramon單機基礎版界面如下圖所示:
Paramon單機專業版界面如下圖所示:
Paramon單機版本以三個維度組成:區域、顏色、方向。
序號 | 維度 | 含義 |
1 | 區域 | 以不同的區域顯示不同的性能指標項 |
2 | 顏色 | 以不同顏色表示不同的性能指標項 |
3 | 方向 | 以不同的方向表示不同性能指標項的增長 |
Paramon軟體在監控結點、機群系統性能狀態的同時,將性能數據保存為.para套用性能特徵檔案,實時保存套用運行現場,供離線性能分析使用。
Para檔案的命名方式為:
<NODELIST>_<TIME>_<NUM>N.para
NODELIST:包含被監控結點的列表檔案名稱
TIME:開始記錄para檔案的時間(月日時分)
NUM:數字(1,2,3,…,n)代表所監控的結點數
例如:
Paratera_12090253_1N.para
軟體特點
序號 | 特點 | 含義 |
1 | 高易用性 | 一鍵啟動,圖形操作,無需代碼級或指令級的複雜操作,快速監控套用性能狀態。 |
2 | 高可靠性 | ØParamon後台守護進程占用系統負載小於0.1%; Ø提供校驗標識,確保數據傳輸的可靠性。 |
3 | 高實用性 | Ø以清晰醒目的各種顏色在不同區域顯示指標數據,讓用戶輕鬆了解結點狀態。 ØParamon前台系統的顯示界面,可以運行在任意結點上,方便用戶隨時隨地了解套用性能狀態; ØParamon前台系統支持多種作業系統環境。 |
4 | 高擴展性 | 通過Paramon軟體的自定義模組功能,用戶可以結合自身實際情況,對關心的性能指標項進行收集。 |
部署環境
Paramon軟體依據部署類型分為前台系統和後台系統;後台系統又分為伺服器端程式和客戶端程式。在HPC機群環境中,Paramon軟體前台系統和後台系統中伺服器端程式通常部署在管理結點上,Paramon軟體後台系統中客戶端程式通常部署在計算結點上。其中,後台系統中的伺服器端軟體包括了客戶端軟體的功能。
Paramon軟體單機版不區分前台系統和後台系統。
Paramon軟體各版本所支持的作業系統如下表所示:
序號 | 作業系統 | 單機基礎版 | 機群基礎版 | 單機專業版 | 機群專業版 |
1 | RHEL5-x86 | √ | 前台/後台 | √ | 前台/後台 |
2 | RHEL5-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
3 | RHEL4-x86 | √ | 前台/後台 | √ | 前台/後台 |
4 | RHEL4-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
5 | RHEL6-x86 | √ | 前台/後台 | √ | 前台/後台 |
6 | RHEL6-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
7 | CentOS4-x86 | √ | 前台/後台 | √ | 前台/後台 |
8 | CentOS4-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
9 | CentOS5-x86 | √ | 前台/後台 | √ | 前台/後台 |
10 | CentOS5-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
11 | SLES10-x86 | √ | 前台/後台 | √ | 前台/後台 |
12 | SLES10-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
13 | SLES11-x86 | √ | 前台/後台 | √ | 前台/後台 |
14 | SLES11-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
15 | Fedora14-x86 | √ | 前台/後台 | √ | 前台/後台 |
16 | Fedora14-x86_64 | √ | 前台/後台 | √ | 前台/後台 |
17 | WindowsXP-x86 | 前台 | 前台 | ||
18 | WindowsXP-x86_64 | 前台 | 前台 | ||
19 | Windows7-x86 | 前台 | 前台 | ||
20 | Windows7-x86_64 | 前台 | 前台 |