單機輕松10萬QPS的redis竟然是單線程的?!很多人都認為高并發就意味著多核心多進程,但這兩者之間并沒有特別大的聯系。除了Redis之外,像Node.JS也是如此,那么為什么Redis能夠如此之快呢?
首先,我們得了解下常見的網絡模型,當客戶端連接到服務器的時候,服務器有下面幾個步驟:
- 從Socket中讀取客戶端傳輸過來的數據
- 進行服務器相關邏輯的處理
- 把數據寫回到連接客戶端的Socket當中
這就是我們常見的同步IO,這種IO方式存在什么問題呢?就是當從Socket中讀取數據的時候,數據很有可能還沒有從客戶端傳到服務端,那么這個線程就一直會在那邊等,直到讀到足夠多的數據從客戶端傳上來,這個效率自然就高不上去。就好比一個人去釣魚,一次只放一條魚竿,然后守在旁邊一直盯著這條魚竿,直到魚兒上鉤再拉起來,中間做不了其他事情。
要提高機器的運行效率,我們有兩件事情要做,一個是使用非阻塞IO,另一個是進行多路復用。
首先,什么是非阻塞IO呢?原本,我們從Socket讀取數據的時候,約定讀4kb,如果讀取不夠,就在那里傻等,現在變成了讀取數據的時候,采用的是非阻塞的方法,如果讀取不到4kb的數據,那么有多少就返回多少,等待下一次讀取。就像剛剛釣魚中的例子,原先我們是一直盯著魚竿看,現在變成了我們看一下魚竿,然后就可以低頭玩手機,干其他事情。
其次是多路復用,既然我們不用死盯著一根魚竿,為什么我們不一口氣多開多幾條魚竿呢?等到魚竿有動靜了,再去看看。Redis亦是如此,在Redis中,采用到多路復用的技術,一個線程連接多個客戶端。在linux操作系統中,采用的是Epoll,一旦有Socket讀寫事件發生,Linux的內核會通知線程進行處理。
有了上述的異步IO與多路復用之后,Redis會維護一個指令隊列,把從客戶端中收到的指令放在隊列當中。隊列當中的指令會排隊執行,進行客戶端要求的各種操作。當Redis服務端完成任務之后,會將結果放入響應隊列當中,等待恰當的時候,寫給客戶端。
正因為Redis是單線程的服務,所以Redis在使用的時候,要注意不要使用O(N)級別的指令,免得系統資源被占用,從而拖慢整個系統。
其實,說Redis是個單線程的服務也不太準確,在Redis的后臺,進行定時任務處理、進行持久化的時候,是會通過其他線程進行處理的。
總結
Redis為什么單線程也能保持如此高的并發呢?最重要的亮點,就是異步IO與多路復用,記住了么?