1. 前言
上周,對性能測試系列專題,在公號內(nèi)發(fā)表了第一篇介紹:
【性能系列連載一】開篇:性能測試不可不知的“干貨”,但反響貌似并不太好,但既然此前已答應了部分讀者要連載分享性能這塊的知識,含著淚也得繼續(xù)寫。
性能測試的基礎:就是在確保功能實現(xiàn)正確的前提下,通過合適的性能測試加壓方式和策略,并收集考察服務端應用程序的各項性能指標,以及服務器硬件資源的使用情況,來評估是否存在性能問題隱患。
那今天作為性能測試系列的第二篇,主要會為大家介紹在服務端性能測試中,常見的性能指標有哪些。
2. 性能指標分類
從性能測試分析度量的度角來看,可以從如下幾個維度來收集考察各項性能指標:
系統(tǒng)性能指標
資源性能指標
中間件指標
數(shù)據(jù)庫指標
穩(wěn)定性指標
可擴展性指標
可靠性指標
下面將從如上這幾個維度,分別從各自維度常見指標,以及指標含義、指標行業(yè)參考標準等方面進行介紹。
3. 系統(tǒng)性能指標
系統(tǒng)性能指標,常見的可從如下幾類進行參考:
響應時間
系統(tǒng)處理能力
吞吐量
并發(fā)用戶數(shù)
錯誤率
3.1 響應時間
定義和解釋:響應時間,簡稱RT。是指系統(tǒng)對請求作出響應的時間,可以理解為是指用戶從客戶端發(fā)起一個請求開始,到客戶端接收到從服務器端返回的響應結(jié)束,整個過程所耗費的時間。直觀上看,這個指標與人對軟件性能的主觀感受是非常一致的,因為它完整地記錄了整個計算機系統(tǒng)處理請求的時間。
在性能檢測中一般以壓力發(fā)起端至被壓測服務器返回處理結(jié)果的時間為計量,單位一般為秒或毫秒,由于一個系統(tǒng)通常會提供許多功能,而不同功能的處理邏輯也千差萬別,因而不同功能的響應時間也不盡相同,甚至同一功能在不同輸入數(shù)據(jù)的情況下響應時間也不相同。所以,在討論一個系統(tǒng)的響應時間時,通常是指該系統(tǒng)所有功能的平均時間或者所有功能的最大響應時間。
行業(yè)參考標準:
不同行業(yè)不同業(yè)務可接受的響應時間是不同的,一般情況,對于在線實時交易:
互聯(lián)網(wǎng)企業(yè):500毫秒以下,例如淘寶業(yè)務10毫秒左右。
金融企業(yè):1秒以下為佳,部分復雜業(yè)務3秒以下。
保險企業(yè):3秒以下為佳。
制造業(yè):5秒以下為佳。
時間窗口:不同數(shù)據(jù)量結(jié)果是不一樣的,大數(shù)據(jù)量的情況下,2小時內(nèi)完成。
需要指出的是,響應時間的絕對值并不能直接反映軟件的性能的高低,軟件性能的高低實際上取決于用戶對該響應時間的接受程度。
3.2 系統(tǒng)處理能力
定義和解釋:系統(tǒng)處理能力是指系統(tǒng)在利用系統(tǒng)硬件平臺和軟件平臺進行信息處理的能力。系統(tǒng)處理能力通過系統(tǒng)每秒鐘能夠處理的交易數(shù)量來評價,交易有兩種理解:一是業(yè)務人員角度的一筆業(yè)務過程;二是系統(tǒng)角度的一次交易申請和響應過程。前者稱為業(yè)務交易過程,后者稱為事務。兩種交易指標都可以評價應用系統(tǒng)的處理能力。
一般情況下,系統(tǒng)處理能力又用以下幾個指標來度量:
HPS(Hits Per Second) :每秒點擊次數(shù),單位是次/秒。
TPS(Transaction per Second):系統(tǒng)每秒處理交易數(shù),單位是筆/秒。
QPS(Query per Second):系統(tǒng)每秒處理查詢次數(shù),單位是次/秒。
對于互聯(lián)網(wǎng)業(yè)務中,如果某些業(yè)務有且僅有一個請求連接,那么TPS=QPS=HPS,一般情況下用TPS來衡量整個業(yè)務流程,用QPS來衡量接口查詢次數(shù),用HPS來表示對服務器點擊請求。
行業(yè)參考標準:
無論TPS、QPS、HPS,此指標是衡量系統(tǒng)處理能力非常重要的指標,越大越好,根據(jù)經(jīng)驗,一般情況下:
金融行業(yè):1000TPS~50000TPS,不包括互聯(lián)網(wǎng)化的活動
保險行業(yè):100TPS~100000TPS,不包括互聯(lián)網(wǎng)化的活動
制造行業(yè):10TPS~5000TPS
互聯(lián)網(wǎng)電子商務:10000TPS~1000000TPS
互聯(lián)網(wǎng)中型網(wǎng)站:1000TPS~50000TPS
互聯(lián)網(wǎng)小型網(wǎng)站: 500TPS~10000TPS
3.3 吞吐量
定義和解釋:吞吐量是指系統(tǒng)在單位時間內(nèi)處理請求的數(shù)量。
對于單用戶的系統(tǒng),響應時間可以很好地度量系統(tǒng)的性能,但對于并發(fā)系統(tǒng),通常需要用吞吐量作為性能指標。
而對于一個多用戶的系統(tǒng),如果只有一個用戶使用時系統(tǒng)的平均響應時間是t,當有你n個用戶使用時,每個用戶看到的響應時間通常并不是n×t,而往往比n×t小很多(當然,在某些特殊情況下也可能比n×t大,甚至大很多)。一般而言,吞吐量是一個比較通用的指標,兩個具有不同用戶數(shù)和用戶使用模式的系統(tǒng),如果其最大吞吐量基本一致,則可以判斷兩個系統(tǒng)的處理能力基本一致。
3.4 并發(fā)用戶數(shù)
定義和解釋:并發(fā)用戶數(shù)指在同一時刻內(nèi),登錄系統(tǒng)并進行業(yè)務操作的用戶數(shù)量。
并發(fā)用戶數(shù)對于長連接系統(tǒng)來說最大并發(fā)用戶數(shù)即是系統(tǒng)的并發(fā)接入能力。對于短連接系統(tǒng)而言最大并發(fā)用戶數(shù)并不等于系統(tǒng)的并發(fā)接入能力,而是與系統(tǒng)架構(gòu)、系統(tǒng)處理能力等各種情況相關(guān)。
與吞吐量相比,并發(fā)用戶數(shù)是一個更直觀但也更籠統(tǒng)的性能指標。實際上,并發(fā)用戶數(shù)是一個非常不準確的指標,因為用戶不同的使用模式會導致不同用戶在單位時間發(fā)出不同數(shù)量的請求。
3.5 錯誤率
定義和解釋:錯誤率簡稱FR,指系統(tǒng)在負載情況下,失敗交易的概率。錯誤率=(失敗交易數(shù)/交易總數(shù))*100%。
行業(yè)參考標準:
不同系統(tǒng)對錯誤率的要求不同,但一般不超出千分之六,即成功率不低于99.4%
4. 資源性能指標
資源性能指標,常見的可從如下幾類進行參考:
CPU
內(nèi)存
磁盤吐吞量
網(wǎng)絡吐吞量
4.1 CPU
定義和解釋:CPU又稱為中央處理器,是一塊超大規(guī)模的集成電路,是一臺計算機的運算核心(Core)和控制核心( Control Unit)。它的功能主要是解釋計算機指令以及處理計算機軟件中的數(shù)據(jù)。
行業(yè)參考標準:
CPU指標主要指的CPU利用率,包括用戶態(tài)(user)、系統(tǒng)態(tài)(sys)、等待態(tài)(wait)、空閑態(tài)(idle)。
CPU 利用率要低于業(yè)界警戒值范圍之內(nèi),即小于或者等于75%;
CPU sys%小于或者等于30%;
CPU wait%小于或者等于5%;
4.2 內(nèi)存
定義和解釋:內(nèi)存是計算機中重要的部件之一,它是與CPU進行溝通的橋梁。計算機中所有程序的運行都是在內(nèi)存中進行的,因此內(nèi)存的性能對計算機的影響非常大。
行業(yè)參考標準:
現(xiàn)在的操作系統(tǒng)為了最大利用內(nèi)存,在內(nèi)存中存放了緩存,因此內(nèi)存利用率100%并不代表內(nèi)存有瓶頸,衡量系統(tǒng)內(nèi)存是否有瓶頸主要靠SWAP(與虛擬內(nèi)存交換)交換空間利用率,一般情況下,SWAP交換空間利用率要低于70%,太多的交換將會引起系統(tǒng)性能低下。
4.3 磁盤吐吞量
定義和解釋:磁盤吞吐量簡稱為Disk Throughput,是指在無磁盤故障的情況下單位時間內(nèi)通過磁盤的數(shù)據(jù)量。
行業(yè)參考標準:
磁盤指標主要有每秒讀寫多少兆,磁盤繁忙率,磁盤隊列數(shù),平均服務時間,平均等待時間,空間利用率。其中磁盤繁忙率是直接反映磁盤是否有瓶頸的的重要依據(jù),一般情況下,磁盤繁忙率要低于70%。
4.4 網(wǎng)絡吐吞量
定義和解釋:網(wǎng)絡吞吐量簡稱為Network Throughput,是指在無網(wǎng)絡故障的情況下單位時間內(nèi)通過的網(wǎng)絡的數(shù)據(jù)數(shù)量。單位為Byte/s。網(wǎng)絡吞吐量指標用于衡量系統(tǒng)對于網(wǎng)絡設備或鏈路傳輸能力的需求。當網(wǎng)絡吞吐量指標接近網(wǎng)絡設備或鏈路最大傳輸能力時,則需要考慮升級網(wǎng)絡設備。
行業(yè)參考標準:
網(wǎng)絡吞吐量指標主要有每秒有多少兆流量進出,一般情況下不能超過設備或鏈路最大傳輸能力的70%。
5. 中間件指標
常用的中間件例如Tomcat、Weblogic等指標主要包括JVM, ThreadPool, JDBC,具體如下:
一級指標二級指標單位解釋
GCGC頻率每秒多少次java虛擬機垃圾部分回收頻率
GCFull GC頻率每小時多少次java虛擬機垃圾完全回收頻率
GCFull GC平均時長秒用于垃圾完全回收的平均時長
GCFull GC最大時長秒用于垃圾完全回收的最大時長
GC堆使用率百分比堆使用率
ThreadPoolActive Thread Count個活動的線程數(shù)
ThreadPoolPending User Request個處于排隊的用戶請求個數(shù)
JDBCJDBC Active Connection個JDBC活動連接數(shù)
行業(yè)參考標準:
當前正在運行的線程數(shù)不能超過設定的最大值。一般情況下系統(tǒng)性能較好的情況下,線程數(shù)最小值設置50和最大值設置200比較合適。
當前運行的JDBC連接數(shù)不能超過設定的最大值。一般情況下系統(tǒng)性能較好的情況下,JDBC最小值設置50和最大值設置200比較合適。
GC頻率不能頻繁,特別是FULL GC更不能頻繁,一般情況下系統(tǒng)性能較好的情況下,JVM最小堆大小和最大堆大小分別設置1024M比較合適。
6. 數(shù)據(jù)庫指標
常用的數(shù)據(jù)庫例如MySQL指標主要包括SQL、吞吐量、緩存命中率、連接數(shù)等,具體如下:
一級指標二級指標單位解釋
SQL耗時微秒執(zhí)行SQL耗時
吞吐量QPS個每秒查詢次數(shù)
吞吐量TPS個每秒事務次數(shù)
命中率Key Buffer命中率百分之索引緩沖區(qū)命中率
命中率InnoDB Buffer命中率百分比InnoDB緩沖區(qū)命中率
命中率Query Cache命中率百分比查詢緩存命中率
命中率Table Cache命中率百分比表緩存命中率數(shù)
命中率Thread Cache命中率百分比線程緩存命中率
鎖等待次數(shù)次鎖等待次數(shù)
鎖等待時間微秒鎖等待時間
行業(yè)參考標準:
SQL耗時越小越好,一般情況下微秒級別。
命中率越高越好,一般情況下不能低于95%。
鎖等待次數(shù)越低越好,等待時間越短越好。
7. 穩(wěn)定性指標
最短穩(wěn)定時間:系統(tǒng)按照最大容量的80%或標準壓力(系統(tǒng)的預期日常壓力)情況下運行,能夠穩(wěn)定運行的最短時間。
一般來說,對于正常工作日(8小時)運行的系統(tǒng),至少應該能保證系統(tǒng)穩(wěn)定運行8小時以上。
對于7*24運行的系統(tǒng),至少應該能夠保證系統(tǒng)穩(wěn)定運行24小時以上。如果系統(tǒng)不能穩(wěn)定的運行,上線后,隨著業(yè)務量的增長和長時間運行,將會出現(xiàn)性能下降甚至崩潰的風險。
參考標準:
TPS曲線穩(wěn)定,沒有大幅度的波動。
各項資源指標沒有泄露或異常情況。
8. 可擴展性指標
定義和解釋:是指應用軟件或操作系統(tǒng)以群集方式部署,增加的硬件資源與增加的處理能力之間的關(guān)系。
計算公式為:(增加性能/原始性能)/(增加資源/原始資源)*100%。
擴展能力應通過多輪測試獲得擴展指標的變化趨勢。一般擴展能力非常好的應用系統(tǒng),擴展指標應是線性或接近線性的,現(xiàn)在很多大規(guī)模的分布式系統(tǒng)的擴展能力非常好。
參考標準:
理想的擴展能力是資源增加幾倍,性能就提升幾倍。擴展能力至少在70%以上。
9. 可靠性指標
對于服務端性能測試,從系統(tǒng)可靠性指標度量分析時,常見從三類來入手:
雙機熱備
集群
備份和恢復
9.1 雙機熱備
對于將雙機熱備作為可靠性保障手段的系統(tǒng),可衡量的指標如下:
節(jié)點切換是否成功及其消耗時間。
雙機切換是否有業(yè)務中斷。
節(jié)點回切是否成功及其耗時。
雙機回切是否有業(yè)務中斷。
節(jié)點回切過程中的數(shù)據(jù)丟失量在進行雙機切換的同時,使用壓力發(fā)生工具模擬實際業(yè)務發(fā)生情況,對應用保持一定的性能壓力,保證測試結(jié)果符合生產(chǎn)實際情況。
9.2 集群
對于使用集群方式的系統(tǒng),主要通過以下方式考量其集群可靠性:
集群中某個節(jié)點出現(xiàn)故障時,系統(tǒng)是否有業(yè)務中斷情況出現(xiàn)
在集群中新增一個節(jié)點時,是否需要重啟系統(tǒng)
當故障節(jié)點恢復后,加入集群,是否需要重啟系統(tǒng)
當故障節(jié)點恢復后,加入集群,系統(tǒng)是否有業(yè)務中斷情況出現(xiàn)
節(jié)點切換需要多長時間在驗證集群可靠性的同時,需根據(jù)具體情況使用壓力工具模擬實際業(yè)務發(fā)生相關(guān)情況,對應用保持一定的性能壓力,確保測試結(jié)果符合生產(chǎn)實際情況。
9.3 備份和恢復
本指標為了驗證系統(tǒng)的備份/恢復機制是否有效可靠,包括系統(tǒng)的備份和恢復、數(shù)據(jù)庫的備份和恢復、應用的備份和恢復,包括以下測試內(nèi)容:
備份是否成功及其消耗時間。
備份是否使用腳本自動化完成。
恢復是否成功及其消耗時間。
恢復是否使用腳本自動化完成指標體系的運用原則。
指標項的采用和考察取決于對相應系統(tǒng)的測試目的和測試需求。被測系統(tǒng)不一樣,測試目的不一樣,測試需求也不一樣,考察的指標項也有很大差別。
部分系統(tǒng)涉及額外的前端用戶接入能力的,需要考察用戶接入并發(fā)能力指標。
對于批量處理過程的性能驗證,主要考慮批量處理效率并估算批量處理時間窗口。
如測試目標涉及到系統(tǒng)性能容量,測試需求中應根據(jù)相關(guān)指標項的定義,明確描述性能指標需求。
測試指標獲取后,需說明相關(guān)的前提條件(如在多少的業(yè)務量、系統(tǒng)資源情況等)。