前言
分布式環(huán)境下應對高并發(fā)保證服務穩(wěn)定幾招,按照個人理解,優(yōu)先級從高到低分別為緩存、限流、降級、熔斷,每招都有它的作用,本文重點就講講限流這部分。
坦白講,其實上面的說法也不準確,因為服務降級、熔斷本身也是限流的一種,因為它們本質(zhì)上也是阻斷了流量進來,但是本文希望大家可以把限流當做一個單純的名詞來理解,看一下對請求做流控的幾種算法及具體實現(xiàn)方式。
為什么要限流
其實很好理解的一個問題,為什么要限流,自然就流量過大了唄,一個對外服務有很多場景都會流量增大:
- 業(yè)務用戶量不斷攀升
- 各種促銷
- 網(wǎng)絡爬蟲
- 惡意刷單
注意這個"大",1000QPS大嗎?5000QPS大嗎?10000QPS大么?沒有答案,因為沒有標準,因此,"大"一定是和正常流量相比的大。流量一大,服務器扛不住,扛不住就掛了,掛了沒法提供對外服務導致業(yè)務直接熔斷。怎么辦,最直接的辦法就是從源頭把流量限制下來,例如服務器只有支撐1000QPS的處理能力,那就每秒放1000個請求,自然保證了服務器的穩(wěn)定,這就是限流。
下面看一下常見的兩種限流算法。
漏桶算法
漏桶算法的原理比較簡單,水(請求)先進入到漏桶里,人為設(shè)置一個最大出水速率,漏桶以<=出水速率的速度出水,當水流入速度過大會直接溢出(拒絕服務):
因此,這個算法的核心為:
- 存下請求
- 勻速處理
- 多于丟棄
因此這是一種強行限制請求速率的方式,但是缺點非常明顯,主要有兩點:
- 無法面對突發(fā)的大流量----比如請求處理速率為1000,容量為5000,來了一波2000/s的請求持續(xù)10s,那么后5s的請求將全部直接被丟棄,服務器拒絕服務,但是實際上網(wǎng)絡中突發(fā)一波大流量尤其是短時間的大流量是非常正常的,超過容量就拒絕,非常簡單粗暴
- 無法有效利用網(wǎng)絡資源----比如雖然服務器的處理能力是1000/s,但這不是絕對的,這個1000只是一個宏觀服務器處理能力的數(shù)字,實際上一共5秒,每秒請求量分別為1200、1300、1200、500、800,平均下來qps也是1000/s,但是這個量對服務器來說完全是可以接受的,但是因為限制了速率是1000/s,因此前面的三秒,每秒只能處理掉1000個請求而一共打回了700個請求,白白浪費了服務器資源
所以,通常來說利用漏桶算法來限流,實際場景下用得不多。
令牌桶算法
令牌桶算法是網(wǎng)絡流量整形(Traffic Shaping)和限流(Rate Limiting)中最常使用的一種算法,它可用于控制發(fā)送到網(wǎng)絡上數(shù)據(jù)的數(shù)量并允許突發(fā)數(shù)據(jù)的發(fā)送。
從某種意義上來說,令牌桶算法是對漏桶算法的一種改進,主要在于令牌桶算法能夠在限制調(diào)用的平均速率的同時還允許一定程度的突發(fā)調(diào)用,來看下令牌桶算法的實現(xiàn)原理:
整個的過程是這樣的:
- 系統(tǒng)以恒定的速率產(chǎn)生令牌,然后將令牌放入令牌桶中
- 令牌桶有一個容量,當令牌桶滿了的時候,再向其中放入的令牌就會被丟棄
- 每次一個請求過來,需要從令牌桶中獲取一個令牌,假設(shè)有令牌,那么提供服務;假設(shè)沒有令牌,那么拒絕服務
那么,我們再看一下,為什么令牌桶算法可以防止一定程度的突發(fā)流量呢?可以這么理解,假設(shè)我們想要的速率是1000QPS,那么往桶中放令牌的速度就是1000個/s,假設(shè)第1秒只有800個請求,那意味著第2秒可以容許1200個請求,這就是一定程度突發(fā)流量的意思,反之我們看漏桶算法,第一秒只有800個請求,那么全部放過,第二秒這1200個請求將會被打回200個。
注意上面多次提到一定程度這四個字,這也是我認為令牌桶算法最需要注意的一個點。假設(shè)還是1000QPS的速率,那么5秒鐘放1000個令牌,第1秒鐘800個請求過來,第2~4秒沒有請求,那么按照令牌桶算法,第5秒鐘可以接受4200個請求,但是實際上這已經(jīng)遠遠超出了系統(tǒng)的承載能力,因此使用令牌桶算法特別注意設(shè)置桶中令牌的上限即可。
總而言之,作為對漏桶算法的改進,令牌桶算法在限流場景下被使用更加廣泛。
RateLimiter使用
上面說了令牌桶算法在限流場景下被使用更加廣泛,接下來我們看一下代碼示例,模擬一下每秒最多過五個請求:
public class RateLimiterTest {
private static final SimpleDateFormat FORMATTER = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
private static final int THREAD_COUNT = 25;
@Test
public void testRateLimiter1() {
RateLimiter rateLimiter = RateLimiter.create(5);
Thread[] ts = new Thread[THREAD_COUNT];
for (int i = 0; i < THREAD_COUNT; i++) {
ts[i] = new Thread(new RateLimiterThread(rateLimiter), "RateLimiterThread-" + i);
}
for (int i = 0; i < THREAD_COUNT; i++) {
ts[i].start();
}
for (;;);
}
public class RateLimiterThread implements Runnable {
private RateLimiter rateLimiter;
public RateLimiterThread(RateLimiter rateLimiter) {
this.rateLimiter = rateLimiter;
}
@Override
public void run() {
rateLimiter.acquire(1);
System.out.println(Thread.currentThread().getName() + "獲取到了令牌,時間 = " + FORMATTER.format(new Date()));
}
}
}
利用RateLimiter.create這個構(gòu)造方法可以指定每秒向桶中放幾個令牌,比方說上面的代碼create(5),那么每秒放置5個令牌,即200ms會向令牌桶中放置一個令牌。這邊代碼寫了一條線程模擬實際場景,拿到令牌那么就能執(zhí)行下面邏輯,看一下代碼執(zhí)行結(jié)果:
RateLimiterThread-0獲取到了令牌,時間 = 2019-08-25 20:58:53
RateLimiterThread-23獲取到了令牌,時間 = 2019-08-25 20:58:54
RateLimiterThread-21獲取到了令牌,時間 = 2019-08-25 20:58:54
RateLimiterThread-19獲取到了令牌,時間 = 2019-08-25 20:58:54
RateLimiterThread-17獲取到了令牌,時間 = 2019-08-25 20:58:54
RateLimiterThread-13獲取到了令牌,時間 = 2019-08-25 20:58:54
RateLimiterThread-9獲取到了令牌,時間 = 2019-08-25 20:58:55
RateLimiterThread-15獲取到了令牌,時間 = 2019-08-25 20:58:55
RateLimiterThread-5獲取到了令牌,時間 = 2019-08-25 20:58:55
RateLimiterThread-1獲取到了令牌,時間 = 2019-08-25 20:58:55
RateLimiterThread-11獲取到了令牌,時間 = 2019-08-25 20:58:55
RateLimiterThread-7獲取到了令牌,時間 = 2019-08-25 20:58:56
RateLimiterThread-3獲取到了令牌,時間 = 2019-08-25 20:58:56
RateLimiterThread-4獲取到了令牌,時間 = 2019-08-25 20:58:56
RateLimiterThread-8獲取到了令牌,時間 = 2019-08-25 20:58:56
RateLimiterThread-12獲取到了令牌,時間 = 2019-08-25 20:58:56
RateLimiterThread-16獲取到了令牌,時間 = 2019-08-25 20:58:57
RateLimiterThread-20獲取到了令牌,時間 = 2019-08-25 20:58:57
RateLimiterThread-24獲取到了令牌,時間 = 2019-08-25 20:58:57
RateLimiterThread-2獲取到了令牌,時間 = 2019-08-25 20:58:57
RateLimiterThread-6獲取到了令牌,時間 = 2019-08-25 20:58:57
RateLimiterThread-10獲取到了令牌,時間 = 2019-08-25 20:58:58
RateLimiterThread-14獲取到了令牌,時間 = 2019-08-25 20:58:58
RateLimiterThread-18獲取到了令牌,時間 = 2019-08-25 20:58:58
RateLimiterThread-22獲取到了令牌,時間 = 2019-08-25 20:58:58
看到,非常標準,在每次消耗一個令牌的情況下,RateLimiter可以保證每一秒內(nèi)最多只有5個線程獲取到令牌,使用這種方式可以很好的做單機對請求的QPS數(shù)控制。
至于為什么2019-08-25 20:58:53這個時間點只有1條線程獲取到了令牌而不是有5條線程獲取到令牌,因為RateLimiter是按照秒計數(shù)的,可能第一個線程是2019-08-25 20:58:53.999秒來的,算在2019-08-25 20:58:53這一秒內(nèi);下一個線程2019-08-25 20:58:54.001秒來,自然就算到2019-08-25 20:58:54這一秒去了。
上面的寫法是RateLimiter最常用的寫法,注意:
- acquire是阻塞的且會一直等待到獲取令牌為止,它有一個返回值為double型,意思是從阻塞開始到獲取到令牌的等待時間,單位為秒
- tryAcquire是另外一個方法,它可以指定超時時間,返回值為boolean型,即假設(shè)線程等待了指定時間后仍然沒有獲取到令牌,那么就會返回給客戶端false,客戶端根據(jù)自身情況是打回給前臺錯誤還是定時重試
RateLimiter預消費
處理請求,每次來一個請求就acquire一把是RateLimiter最常見的用法,但是我們看acquire還有個acquire(int permits)的重載方法,即允許每次獲取多個令牌數(shù)。這也是有可能的,請求數(shù)是一個大維度每次扣減1,有可能服務器按照字節(jié)數(shù)來進行限流,例如每秒最多處理10000字節(jié)的數(shù)據(jù),那每次扣減的就不止1了。
接著我們再看一段代碼示例:
@Test
public void testRateLimiter2() {
RateLimiter rateLimiter = RateLimiter.create(1);
System.out.println("獲取1個令牌開始,時間為" + FORMATTER.format(new Date()));
double cost = rateLimiter.acquire(1);
System.out.println("獲取1個令牌結(jié)束,時間為" + FORMATTER.format(new Date()) + ", 耗時" + cost + "ms");
System.out.println("獲取5個令牌開始,時間為" + FORMATTER.format(new Date()));
cost = rateLimiter.acquire(5);
System.out.println("獲取5個令牌結(jié)束,時間為" + FORMATTER.format(new Date()) + ", 耗時" + cost + "ms");
System.out.println("獲取3個令牌開始,時間為" + FORMATTER.format(new Date()));
cost = rateLimiter.acquire(3);
System.out.println("獲取3個令牌結(jié)束,時間為" + FORMATTER.format(new Date()) + ", 耗時" + cost + "ms");
}
代碼運行結(jié)果為:
獲取1個令牌開始,時間為2019-08-25 21:21:09.973
獲取1個令牌結(jié)束,時間為2019-08-25 21:21:09.976, 耗時0.0ms
獲取5個令牌開始,時間為2019-08-25 21:21:09.976
獲取5個令牌結(jié)束,時間為2019-08-25 21:21:10.974, 耗時0.997237ms
獲取3個令牌開始,時間為2019-08-25 21:21:10.976
獲取3個令牌結(jié)束,時間為2019-08-25 21:21:15.974, 耗時4.996529ms
看到這就是標題所說的預消費能力,也是RateLimiter中允許一定程度突發(fā)流量的實現(xiàn)方式。第二次需要獲取5個令牌,指定的是每秒放1個令牌到桶中,我們發(fā)現(xiàn)實際上并沒有等5秒鐘等桶中積累了5個令牌才能讓第二次acquire成功,而是直接等了1秒鐘就成功了。我們可以捋一捋這個邏輯:
- 第一次請求過來需要獲取1個令牌,直接拿到
- RateLimiter在1秒鐘后放一個令牌,第一次請求預支的1個令牌還上了
- 1秒鐘之后第二次請求過來需要獲得5個令牌,直接拿到
- RateLimiter在花了5秒鐘放了5個令牌,還上了第二次請求預支的5個令牌
- 第三個請求在5秒鐘之后拿到3個令牌
也就是說,前面的請求如果流量大于每秒放置令牌的數(shù)量,那么允許處理,但是帶來的結(jié)果就是后面的請求延后處理,從而在整體上達到一個平衡整體處理速率的效果。
突發(fā)流量的處理,在令牌桶算法中有兩種方式,一種是有足夠的令牌才能消費,一種是先消費后還令牌。后者就像我們0首付買車似的,30萬的車很少有等攢到30萬才全款買的,先簽了相關(guān)合同把車子給你,然后貸款慢慢還,這樣就爽了。RateLimiter也是同樣的道理,先讓請求得到處理,再慢慢還上預支的令牌,客戶端同樣也爽了,否則我假設(shè)預支60個令牌,1分鐘之后才能處理我的請求,不合理也不人性化。
RateLimiter的限制
特別注意RateLimiter是單機的,也就是說它無法跨JVM使用,設(shè)置的1000QPS,那也在單機中保證平均1000QPS的流量。
假設(shè)集群中部署了10臺服務器,想要保證集群1000QPS的接口調(diào)用量,那么RateLimiter就不適用了,集群流控最常見的方法是使用強大的redis:
- 一種是固定窗口的計數(shù),例如當前是2019/8/26 20:05:00,就往這個"2019/8/26 20:05:00"這個key進行incr,當前是2019/8/26 20:05:01,就往"2019/8/26 20:05:01"這個key進行incr,incr后的結(jié)果只要大于我們設(shè)定的值,那么就打回去,小于就相當于獲取到了執(zhí)行權(quán)限
- 一種是結(jié)合lua腳本,實現(xiàn)分布式的令牌桶算法,網(wǎng)上實現(xiàn)還是比較多的
總得來說,集群限流的實現(xiàn)也比較簡單。
總結(jié)
本文主要寫了常見的兩種限流算法漏桶算法與令牌桶算法,并且演示了Guava中RateLimiter的實現(xiàn),相信看到這里的朋友一定都懂了,恭喜你們!
令牌桶算法是最常用的限流算法,它最大的特點就是容許一定程度的突發(fā)流量。
漏桶算法同樣也有自己的應用之處,例如Nginx的限流模塊就是基于漏桶算法的,它最大的特點就是強行限制流量按照指定的比例下發(fā),適合那種對流量有絕對要求的場景,就是流量可以容許在我指定的值之下,可以被多次打回,但是無論如何決不能超過指定的。
雖然令牌桶算法相對更好,但是還是我經(jīng)常說的,使用哪種完全就看大家各自的場景,適合的才是最好的。