Paramon套用運行特徵收集器

Paramon套用運行特徵收集器

Paramon軟體是由北京並行科技有限公司自主設計、研發完成的套用運行特徵收集器,設計目的是進行系統套用運行情況監控與分析,同時為系統調優收集數據。

基本介紹

  • 中文名:Paramon套用運行特徵收集器
  • 發明地址:北京
  • 發明公司:並行科技有限公司
  • 作用:監控與分析
產生背景,軟體介紹,軟體功能,軟體特點,部署環境,

產生背景

隨著計算機硬體的高速發展,多核處理器成為了主流,大規模並行機群、高性能機群和雲計算機群越來越普及。石油領域、氣象領域、航天領域、科研院所等用戶的計算規模不斷發展,因此,各領域用戶的硬體規模呈現爆炸性的增長。面對這一現狀,公司、企業或院校的用戶領導和硬體管理員很難對內部硬體環境的現狀和使用情況有一個直觀的了解。
隨著科學計算的不斷發展,各種計算軟體日趨成熟,可以模擬計算各種複雜模型,完成高解析度、高精度的計算分析;隨著計算機硬體的高速發展,多核處理器成為了主流,大規模並行機群也越來越普及。因此,基於目前的硬體環境,如何來提升套用軟體的運行速度成為很多客戶的迫切需求。而最佳化套用軟體運行速度的前提是獲取整個系統的主要性能參數,通過對這些參數的分析來完成套用軟體的最佳化。所以,如何來實時、準確、詳盡的獲得系統的主要性能參數成為完成最佳化工作的重點。
基於以上的一系列需求,Paramon/Paratune系列軟體問世了。

軟體介紹

Paramon軟體面向IT管理人員、硬體管理員、機房管理員等用戶角色,通過實時監控、採集機群中伺服器的CPU、GPU、記憶體、網路和存儲等關鍵設備的系統級和微架構級性能數據(Gflops、MemoryBandwidth、Vectorization、CPI、GIPS),以圖形化的方式直觀顯示,快速反映提供機群系統中套用軟體隨時間變化的運行特徵,同時了解硬體環境的運行現狀,快速了解機群中隱含的硬體問題,從而在問題發生時第一時間給出解決方案。
Paramon軟體按照功能分為四個版本,如下表所示:
序號
版本
說明
1
ParamonBasicSingleNodeEdition
單機基礎版,提供基礎數據和Gflops信息,通過並行科技網站可以申請下載。
2
ParamonProfessionalSingleNodeEdition
單機專業版,提供基礎數據和高級數據(包括Gflops信息),收費版本,通過購買獲得。
3
ParamonBasicEdition
機群基礎版,提供基礎數據和Gflops信息,通過聯繫並行科技銷售人員免費獲得。
4
ParamonProfessionalEdition
機群專業版,提供基礎數據和高級數據(包括Gflops信息),收費版本,通過購買獲得。

軟體功能

Paramon軟體不同版本所對應的功能如下表所示:
功能
單機基礎版
機群基礎版
單機專業版
機群專業版
1
支持Linux




2
支持Windows
前台系統
前台系統
3
每秒鐘實時刷新




4
單結點顯示




5
CPU系統級數據-CPUUSED




6
CPU系統級數據-CPUSYS




7
記憶體利用率




8
SWAP利用率




9
乙太網網路接收、傳送速率




10
磁碟讀寫速率




11
大規模機群(支持大於1000結點的機群環境,支持不同廠商的混合機群)


12
遠程登錄管理


13
遠程命令管理


14
報警模組

15
高速網際網路(Infiniband)模組


16
NFS模組


17
Gflops浮點計算性能




18
記憶體頻寬數據


19
CPU微架構數據-CPI


20
CPU微架構數據-Vec


21
CPU微架構數據-GIPS


22
NVidiaCUDAGPU利用率


23
多網卡機器上每個網卡的數據


24
SWAP-in/SWAP-out信息


25
Intel-x86/Intel-x86_64




26
AMD-x86/AMD-x86_64




Paramon軟體機群版監控界面根據監控機群結點數量生成相同數量的監控單體(每個監控單體與單機版一致),針對版本的不同,每監控單體顯示的性能指標數據不同。
Paramon軟體機群監控界面請見用戶案例部分。
Paramon單機基礎版界面如下圖所示:
Paramon單機專業版界面如下圖所示:
Paramon套用運行特徵收集器
Paramon單機版本以三個維度組成:區域、顏色、方向。
Paramon套用運行特徵收集器
序號
維度
含義
1
區域
以不同的區域顯示不同的性能指標項
2
顏色
以不同顏色表示不同的性能指標項
3
方向
以不同的方向表示不同性能指標項的增長
Paramon軟體在監控結點、機群系統性能狀態的同時,將性能數據保存為.para套用性能特徵檔案,實時保存套用運行現場,供離線性能分析使用。
Para檔案的命名方式為:
<NODELIST>_<TIME>_<NUM>N.para
NODELIST:包含被監控結點的列表檔案名稱
TIME:開始記錄para檔案的時間(月日時分)
NUM:數字(1,2,3,…,n)代表所監控的結點數
例如:
Paratera_12090253_1N.para

軟體特點

序號
特點
含義
1
高易用性
一鍵啟動,圖形操作,無需代碼級或指令級的複雜操作,快速監控套用性能狀態。
2
高可靠性
&Oslash;Paramon後台守護進程占用系統負載小於0.1%;
&Oslash;提供校驗標識,確保數據傳輸的可靠性。
3
高實用性
&Oslash;以清晰醒目的各種顏色在不同區域顯示指標數據,讓用戶輕鬆了解結點狀態。
&Oslash;Paramon前台系統的顯示界面,可以運行在任意結點上,方便用戶隨時隨地了解套用性能狀態;
&Oslash;Paramon前台系統支持多種作業系統環境。
4
高擴展性
通過Paramon軟體的自定義模組功能,用戶可以結合自身實際情況,對關心的性能指標項進行收集。

部署環境

Paramon軟體依據部署類型分為前台系統和後台系統;後台系統又分為伺服器端程式和客戶端程式。在HPC機群環境中,Paramon軟體前台系統和後台系統中伺服器端程式通常部署在管理結點上,Paramon軟體後台系統中客戶端程式通常部署在計算結點上。其中,後台系統中的伺服器端軟體包括了客戶端軟體的功能。
Paramon軟體單機版不區分前台系統和後台系統。
Paramon軟體各版本所支持的作業系統如下表所示:
序號
作業系統
單機基礎版
機群基礎版
單機專業版
機群專業版
1
RHEL5-x86

前台/後台

前台/後台
2
RHEL5-x86_64

前台/後台

前台/後台
3
RHEL4-x86

前台/後台

前台/後台
4
RHEL4-x86_64

前台/後台

前台/後台
5
RHEL6-x86

前台/後台

前台/後台
6
RHEL6-x86_64

前台/後台

前台/後台
7
CentOS4-x86

前台/後台

前台/後台
8
CentOS4-x86_64

前台/後台

前台/後台
9
CentOS5-x86

前台/後台

前台/後台
10
CentOS5-x86_64

前台/後台

前台/後台
11
SLES10-x86

前台/後台

前台/後台
12
SLES10-x86_64

前台/後台

前台/後台
13
SLES11-x86

前台/後台

前台/後台
14
SLES11-x86_64

前台/後台

前台/後台
15
Fedora14-x86

前台/後台

前台/後台
16
Fedora14-x86_64

前台/後台

前台/後台
17
WindowsXP-x86
前台
前台
18
WindowsXP-x86_64
前台
前台
19
Windows7-x86
前台
前台
20
Windows7-x86_64
前台
前台

相關詞條

熱門詞條

聯絡我們