日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

對于Nginx的驚群問題,我們首先需要理解的是,在nginx啟動過程中,master進程會監(jiān)聽配置文件中指定的各個端口,然后master進程就會調(diào)用fork()方法創(chuàng)建各個子進程,根據(jù)進程的工作原理,子進程是會繼承父進程的全部內(nèi)存數(shù)據(jù)以及監(jiān)聽的端口的,也就是說worker進程在啟動之后也是會監(jiān)聽各個端口的。關(guān)于驚群,指的就是當客戶端有新建連接的請求到來時,就會觸發(fā)各個worker進程的連接建立事件,但是只有一個worker進程能夠正常處理該事件,而其他的worker進程會發(fā)現(xiàn)事件已經(jīng)失效,從而重新循環(huán)進入等待狀態(tài)。這種由于一個事件而“驚”起了所有worker進程的現(xiàn)象就是驚群問題。很明顯,如果所有的worker進程都被觸發(fā)了,那么這將消耗大量的資源,本文則主要講解nginx是如何處理驚群問題的。

1. 解決方式

在前面的文章中,我們講到,每個worker進程被創(chuàng)建的時候,都會調(diào)用ngx_worker_process_init()方法初始化當前worker進程,這個過程中有一個非常重要的步驟,即每個worker進程都會調(diào)用epoll_create()方法為自己創(chuàng)建一個獨有的epoll句柄。對于每一個需要監(jiān)聽的端口,都有一個文件描述符與之對應(yīng),而worker進程只有將該文件描述符通過epoll_ctl()方法添加到當前進程的epoll句柄中,并且監(jiān)聽accept事件,此時才會被客戶端的連接建立事件觸發(fā),從而處理該事件。從這里也可以看出,worker進程如果沒有將所需要監(jiān)聽的端口對應(yīng)的文件描述符添加到該進程的epoll句柄中,那么其是無法被觸發(fā)對應(yīng)的事件的?;谶@個原理,nginx就使用了一個共享鎖來控制當前進程是否有權(quán)限將需要監(jiān)聽的端口添加到當前進程的epoll句柄中,也就是說,只有獲取鎖的進程才會監(jiān)聽目標端口。通過這種方式,就保證了每次事件發(fā)生時,只有一個worker進程會被觸發(fā)。如下圖所示為worker進程工作循環(huán)的一個示意圖:

什么是Nginx驚群問題?如何解決它?

 

這里關(guān)于圖中的流程,需要說明的一點是,每個worker進程在進入循環(huán)之后就會嘗試獲取共享鎖,如果沒有獲取到,就會將所監(jiān)聽的端口的文件描述符從當前進程的epoll句柄中移除(即使并不存在也會移除),這么做的主要目的是防止丟失客戶端連接事件,即使這可能造成少量的驚群問題,但是并不嚴重。試想一下,如果按照理論,在當前進程釋放鎖的時候就將監(jiān)聽的端口的文件描述符從epoll句柄中移除,那么在下一個worker進程獲取鎖之前,這段時間各個端口對應(yīng)的文件描述符是沒有任何epoll句柄進行監(jiān)聽的,此時就會造成事件的丟失。如果反過來,按照圖中的在獲取鎖失敗的時候才移除監(jiān)聽的文件描述符,由于獲取鎖失敗,則說明當前一定有一個進程已經(jīng)監(jiān)聽了這些文件描述符,因而此時移除是安全的。但是這樣會造成的一個問題是,按照上圖,當前進程在一個循環(huán)執(zhí)行完畢的時候,會釋放鎖,然后處理其他的事件,注意這個過程中其是沒有釋放所監(jiān)聽的文件描述符的。此時,如果另一個進程獲取到了鎖,并且監(jiān)聽了文件描述符,那么這個時候就有兩個進程監(jiān)聽了文件描述符,因而此時如果客戶端發(fā)生連接建立事件,那么就會觸發(fā)兩個worker進程。這個問題是可以容忍的,主要原因有兩點:

  • 這個時候發(fā)生的驚群現(xiàn)象只觸發(fā)了更少的worker進程,比起每次都驚起所有的worker進程要好很多;
  • 會發(fā)生這種驚群問題的主要原因是,當前進程釋放了鎖,但是沒有釋放所監(jiān)聽的文件描述符,但是worker進程在釋放鎖之后主要是處理客戶端連接的讀寫事件和檢查標志位,這個過程是非常短的,在處理完之后,其就會嘗試獲取鎖,這個時候就會釋放所監(jiān)聽的文件描述符了,而相較而言,獲取鎖的worker進程在等待處理客戶端的連接建立事件的事件就更長了,因而會發(fā)生驚群問題的概率還是比較小的。

2. 源碼講解

worker進程初始事件的方法主要是在ngx_process_events_and_timers()方法中進行的,下面我們就來看看該方法是如何處理整個流程的,如下是該方法的源碼:

void ngx_process_events_and_timers(ngx_cycle_t *cycle) {  ngx_uint_t flags;  ngx_msec_t timer, delta;  if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {    return;  }  // 這里開始處理事件,對于kqueue模型,其指向的是ngx_kqueue_process_events()方法,  // 而對于epoll模型,其指向的是ngx_epoll_process_events()方法  // 這個方法的主要作用是,在對應(yīng)的事件模型中獲取事件列表,然后將事件添加到ngx_posted_accept_events  // 隊列或者ngx_posted_events隊列中  (void) ngx_process_events(cycle, timer, flags);  // 這里開始處理accept事件,將其交由ngx_event_accept.c的ngx_event_accept()方法處理;  ngx_event_process_posted(cycle, &ngx_posted_accept_events);  // 開始釋放鎖  if (ngx_accept_mutex_held) {    ngx_shmtx_unlock(&ngx_accept_mutex);  }  // 如果不需要在事件隊列中進行處理,則直接處理該事件  // 對于事件的處理,如果是accept事件,則將其交由ngx_event_accept.c的ngx_event_accept()方法處理;  // 如果是讀事件,則將其交由ngx_http_request.c的ngx_http_wait_request_handler()方法處理;  // 對于處理完成的事件,最后會交由ngx_http_request.c的ngx_http_keepalive_handler()方法處理。  // 這里開始處理除accept事件外的其他事件  ngx_event_process_posted(cycle, &ngx_posted_events);}

上面的代碼中,我們省略了大部分的檢查工作,只留下了骨架代碼。首先,worker進程會調(diào)用ngx_trylock_accept_mutex()方法獲取鎖,這其中如果獲取到了鎖就會監(jiān)聽各個端口對應(yīng)的文件描述符。然后會調(diào)用ngx_process_events()方法處理epoll句柄中監(jiān)聽到的事件。接著會釋放共享鎖,最后就是處理已建立連接的客戶端的讀寫事件。下面我們來看一下ngx_trylock_accept_mutex()方法是如何獲取共享鎖的:

ngx_int_t ngx_trylock_accept_mutex(ngx_cycle_t *cycle) {  // 嘗試使用CAS算法獲取共享鎖  if (ngx_shmtx_trylock(&ngx_accept_mutex)) {    // ngx_accept_mutex_held為1表示當前進程已經(jīng)獲取到了鎖    if (ngx_accept_mutex_held && ngx_accept_events == 0) {      return NGX_OK;    }    // 這里主要是將當前連接的文件描述符注冊到對應(yīng)事件的隊列中,比如kqueue模型的change_list數(shù)組    // nginx在啟用各個worker進程的時候,默認情況下,worker進程是會繼承master進程所監(jiān)聽的socket句柄的,    // 這就導致一個問題,就是當某個端口有客戶端事件時,就會把監(jiān)聽該端口的進程都給喚醒,    // 但是只有一個worker進程能夠成功處理該事件,而其他的進程被喚醒之后發(fā)現(xiàn)事件已經(jīng)過期,    // 因而會繼續(xù)進入等待狀態(tài),這種現(xiàn)象稱為"驚群"現(xiàn)象。    // nginx解決驚群現(xiàn)象的方式一方面是通過這里的共享鎖的方式,即只有獲取到鎖的worker進程才能處理    // 客戶端事件,但實際上,worker進程是通過在獲取鎖的過程中,為當前worker進程重新添加各個端口的監(jiān)聽事件,    // 而其他worker進程則不會監(jiān)聽。也就是說同一時間只有一個worker進程會監(jiān)聽各個端口,    // 這樣就避免了"驚群"問題。    // 這里的ngx_enable_accept_events()方法就是為當前進程重新添加各個端口的監(jiān)聽事件的。    if (ngx_enable_accept_events(cycle) == NGX_ERROR) {      ngx_shmtx_unlock(&ngx_accept_mutex);      return NGX_ERROR;    }    // 標志當前已經(jīng)成功獲取到了鎖    ngx_accept_events = 0;    ngx_accept_mutex_held = 1;    return NGX_OK;  }  // 前面獲取鎖失敗了,因而這里需要重置ngx_accept_mutex_held的狀態(tài),并且將當前連接的事件給清除掉  if (ngx_accept_mutex_held) {    // 如果當前進程的ngx_accept_mutex_held為1,則將其重置為0,并且將當前進程在各個端口上的監(jiān)聽    // 事件給刪除掉    if (ngx_disable_accept_events(cycle, 0) == NGX_ERROR) {      return NGX_ERROR;    }    ngx_accept_mutex_held = 0;  }  return NGX_OK;}

上面的代碼中,本質(zhì)上主要做了三件事:

  • 通過ngx_shmtx_trylock()方法嘗試使用CAS方法獲取共享鎖;
  • 獲取鎖之后則調(diào)用ngx_enable_accept_events()方法監(jiān)聽目標端口對應(yīng)的文件描述符;
  • 如果沒有獲取到鎖,則調(diào)用ngx_disable_accept_events()方法釋放所監(jiān)聽的文件描述符;

3. 小結(jié)

本文首先對驚群現(xiàn)象的產(chǎn)生原因進行了講解,然后介紹了nginx是如何解決驚群問題的,最后從源碼角度對nginx處理驚群問題的方式進行了講解。

轉(zhuǎn)自:https://my.oschina.net/zhangxufeng/blog/3151282

分享到:
標簽:Nginx 驚群
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定