基準測試

測試介紹

基準測試是指通過設計科學的測試方法、測試工具和測試系統，實現對一類測試對象的某項性能指標進行定量的和可對比的測試。例如，對計算機CPU進行浮點運算、數據訪問的頻寬和延遲等指標的基準測試，可以使用戶清楚地了解每一款CPU的運算性能及作業吞吐能力是否滿足應用程式的要求；

再如對資料庫管理系統的ACID（Atomicity, Consistency, Isolation, Durability, 原子性、一致性、獨立性和持久性）、查詢時間和在線上事務處理能力等方面的性能指標進行基準測試，也有助於使用者挑選最符合自己需求的資料庫系統。

從以上兩個例子我們可以看出，可測量、可重複、可對比是基準測試的三大原則，其中可測量是指測試的輸入和輸出之間是可達的，也就是測試過程是可以實現的，並且測試的結果可以量化表現；可重複是指按照測試過程實現的結果是相同的或處於可接受的置信區間之內，而不受測試的時間、地點和執行者的影響；可對比是指一類測試對象的測試結果具有線性關係，測試結果的大小直接決定性能的高低。

對於可再現性，基準測試是最好的方法。

在開發階段前期，應該使用基準測試來確定應用程式中是否出現性能倒退。基準測試可以在一個相對短的時間內收集可重複的結果。進行基準測試的最好方法是，每次測試改變一個且只改變一個參數。例如，如果想知道增加JVM記憶體是否會影回響用程式的性能，就逐次遞增JVM記憶體（例如，從1024 MB增至1224 MB，然後是1524 MB，最後是2024 MB），在每個階段收集結果和環境數據，記錄信息，然後轉到下一階段。這樣在分析測試結果時就有跡可循。

基準測試的關鍵是要獲得一致的、可再現的結果。可再現的結果有兩個好處：減少重新運行測試的次數；對測試的產品和產生的數字更為確信。使用的性能測試工具可能會對測試結果產生很大影響。假定測試的兩個指標是伺服器的回響時間和吞吐量，它們會受到伺服器上的負載的影響。伺服器上的負載受兩個因素影響：同時與伺服器通信的連線（或虛擬用戶）的數目，以及每個虛擬用戶請求之間的考慮時間的長短。很明顯，與伺服器通信的用戶越多，負載就越大。同樣，請求之間的考慮時間越短，負載也越大。這兩個因素的不同組合會產生不同的伺服器負載等級。記住，隨著伺服器上負載的增加，吞吐量會不斷攀升，直到到達一個點。

當軟體系統中增加了1個新模組，此時需要做基準測試，以判斷新的模組對整個軟體系統的性能影響。

測試步驟

觀察

我們假設系統管理員購買了一台伺服器，現在看看它的最佳性能。第一步是確定伺服器預期任務。其將作為一個虛擬平台還是運行一個專門的應用程式?確定這些問題之後，就可以開始基準測試了。切記，測量標準和基準測試將根據測試內容和使用的設備而有所變化。例如，如果作為資料庫系統可能會強調處理器測試，而用於網路服務系統的話可能會突出網路性能。

假設

在這個步驟，工程師設定一個基準目標。假設什麼或者測試需要完成什麼?簡單地進行一個度量測試將得出一些試驗結果，但是沒有方向或明確的目標的話，這些結果可能是無用的。為測試創建一個基本的目標，並且所有的測試方法都圍繞這個目標。例如，工程師可能會設法測試其占用的記憶體以讓應用程式處於最佳運行狀態。他或她可能因此推測，給定“X”記憶體大小可以達到最佳工作負載。這可以立足於以前的研究，供應商提供的基準或其他的來源。確保你的假設是可測試的。也就是說，不要提出一個只是基於數據的而基準測試卻無法證實的假設。

基準測試

基本介紹

測試介紹

測試步驟

觀察

假設

預測

環境控制

測試

推論和結論

測試的局限性

熱門詞條