一、QPS,每秒查詢
QPS:Queries Per Second意思是“每秒查詢率”,是一臺服務器每秒能夠相應的查詢次數,是對一個特定的查詢服務器在規定時間內所處理流量多少的衡量標準。
互聯網中,作為域名系統服務器的機器的性能經常用每秒查詢率來衡量。
二、TPS,每秒事務
TPS:是TransactionsPerSecond的縮寫,也就是事務數/秒。它是軟件測試結果的測量單位。一個事務是指一個客戶機向服務器發送請求然后服務器做出反應的過程。客戶機在發送請求時開始計時,收到服務器響應后結束計時,以此來計算使用的時間和完成的事務個數。
QPS vs TPS:QPS基本類似于TPS,但是不同的是,對于一個頁面的一次訪問,形成一個TPS;但一次頁面請求,可能產生多次對服務器的請求,服務器對這些請求,就可計入“QPS”之中。如,訪問一個頁面會請求服務器2次,一次訪問,產生一個“T”,產生2個“Q”。
三、RT,響應時間
響應時間:執行一個請求從開始到最后收到響應數據所花費的總體時間,即從客戶端發起請求到收到服務器響應結果的時間。
響應時間RT(Response-time),是一個系統最重要的指標之一,它的數值大小直接反應了系統的快慢。
四、并發數
并發數是指系統同時能處理的請求數量,這個也是反應了系統的負載能力。
五、吞吐量
系統的吞吐量(承壓能力)與request對CPU的消耗、外部接口、IO等等緊密關聯。單個request 對CPU消耗越高,外部系統接口、IO速度越慢,系統吞吐能力越低,反之越高。
系統吞吐量幾個重要參數:QPS(TPS)、并發數、響應時間。
- QPS(TPS):(Query Per Second)每秒鐘request/事務 數量
- 并發數: 系統同時處理的request/事務數
- 響應時間: 一般取平均響應時間
理解了上面三個要素的意義之后,就能推算出它們之間的關系:
- QPS(TPS)= 并發數/平均響應時間
- 并發數 = QPS*平均響應時間
六、實際舉例
我們通過一個實例來把上面幾個概念串起來理解。按二八定律來看,如果每天 80% 的訪問集中在 20% 的時間里,這 20% 時間就叫做峰值時間。
- 公式:( 總PV數 * 80% ) / ( 每天秒數 * 20% ) = 峰值時間每秒請求數(QPS)
- 機器:峰值時間每秒QPS / 單臺機器的QPS = 需要的機器
1、每天300w PV 的在單臺機器上,這臺機器需要多少QPS?
( 3000000 * 0.8 ) / (86400 * 0.2 ) = 139 (QPS)
2、如果一臺機器的QPS是58,需要幾臺機器來支持?
139 / 58 = 3
七、最佳線程數、QPS、RT
1、單線程QPS公式:QPS=1000ms/RT
對同一個系統而言,支持的線程數越多,QPS越高。假設一個RT是80ms,則可以很容易的計算出QPS,QPS = 1000/80 = 12.5
多線程場景,如果把服務端的線程數提升到2,那么整個系統的QPS則為 2*(1000/80) = 25, 可見QPS隨著線程的增加而線性增長,那QPS上不去就加線程唄,聽起來很有道理,公司也說的通,但是往往現實并非如此。
2、QPS和RT的真實關系
我們想象的QPS、RT關系如下,
實際的QPS、RT關系如下,
3、最佳線程數量
剛好消耗完服務器的瓶頸資源的臨界線程數,公式如下
最佳線程數量=((線程等待時間+線程cpu時間)/線程cpu時間)* cpu數量
特性:
- 在達到最佳線程數的時候,線程數量繼續遞增,則QPS不變,而響應時間變長,持續遞增線程數量,則QPS開始下降。
- 每個系統都有其最佳線程數量,但是不同狀態下,最佳線程數量是會變化的。
- 瓶頸資源可以是CPU,可以是內存,可以是鎖資源,IO資源:超過最佳線程數-導致資源的競爭,超過最佳線程數-響應時間遞增。