Linux服務(wù)端最大并發(fā)數(shù)是多少？-魔扣目錄

文章來源：
https://mp.weixin.qq.com/s/ZynmF0GaplHsabIovopMSw

原文作者：程序員大白啊

1. 開場白

在開始今天的文章之前，先拋一個面試題出來：

你接觸過的單機(jī)最大并發(fā)數(shù)是多少？
你認(rèn)為當(dāng)前正常配置的服務(wù)器物理機(jī)最大并發(fā)數(shù)可以到多少？
說說你的理解和分析。

思考幾分鐘，如果你可以有理有據(jù)地說出答案，那確實就不用再往下看了，關(guān)上手機(jī)去陪陪家人是個不錯的選擇。

思考幾分鐘，如果你沒有頭緒或者對答案不確定，那么你先不用著急關(guān)閉頁面去玩耍，你應(yīng)該繼續(xù)往下看，因為這個問題很不錯。

對于后端開發(fā)人員來說，并發(fā)數(shù)往往和技術(shù)難度是呈正相關(guān)的，實際上也確實如此：體量決定架構(gòu)。

服務(wù)端根據(jù)不同業(yè)務(wù)場景會有不同的側(cè)重點，單純追求高并發(fā)其實并不是根本目的，高可用&穩(wěn)定性更重要。

所以最終我們的目的是：保證高可用高穩(wěn)定的基礎(chǔ)上追求高并發(fā)，降本增效。

高可用&高并發(fā)是我們直觀感受到的，本質(zhì)上這是個復(fù)雜的系統(tǒng)工程，每個環(huán)節(jié)都會影響結(jié)果，每一塊都值得研究和深入。

2. C10K問題和C10M問題

在2000年初的時候，全球互聯(lián)網(wǎng)的規(guī)模并不大，但是當(dāng)時就已經(jīng)提出了C10K問題，所謂C10K就是單機(jī)1w并發(fā)問題，雖然現(xiàn)在不覺得是個難題了，但是這在當(dāng)初是很有遠(yuǎn)見和挑戰(zhàn)的問題。

C10K問題最早由Dan Kegel發(fā)布于其個人站點，原文鏈接如下:

http://www.kegel.com/c10k.html

相關(guān)資料顯示Dan Kegel目前工作于google，從1978年起開始接觸計算機(jī)編程，是Winetricks和Crosstool的作者，大佬年輕時的照片：

Dan Kegel這篇文章閱讀難度并不大，大白建議從事服務(wù)端開發(fā)或者對高性能網(wǎng)絡(luò)開發(fā)有興趣的讀者嘗試讀一讀。

在APUE第三版都沒有提到epoll，所以我們解決C10K問題的時間并不長，其中IO復(fù)用epoll/kqueue/iocp等技術(shù)對于C10k問題的解決起到了非常重要的作用。

開源大神們基于epoll/kqueue等開發(fā)了諸如libevent/libuv等網(wǎng)絡(luò)庫，從而大幅提高了高并發(fā)網(wǎng)絡(luò)的開發(fā)效率，對于C/C++程序員來說并不陌生。

這里簡單提一下針對下一個10年的展望和挑戰(zhàn)：C10M問題。

站在浪尖的那一批人早就開始思考讓單機(jī)達(dá)到1000w并發(fā)，現(xiàn)在聽起來感覺不可思議，但是要達(dá)到這個目標(biāo)，除了硬件上的提升，更重要的是對系統(tǒng)軟件和協(xié)議棧的改造。

Errata Security的CEO Robert Graham在Shmoocon 2013大會上的演講，大佬重要的觀點是：

不要讓OS內(nèi)核執(zhí)行所有繁重的任務(wù)：將數(shù)據(jù)包處理、內(nèi)存管理、處理器調(diào)度等任務(wù)從內(nèi)核轉(zhuǎn)移到應(yīng)用程序高效地完成，讓諸如linux這樣的OS只處理控制層，數(shù)據(jù)層完全交給應(yīng)用程序來處理。

確實也是如此，難道你不覺得Linux內(nèi)核做了太多不該自己做的事情了嗎？

近幾年出現(xiàn)的DPDK、PFRING、NETMAP等技術(shù)也是類似的思想，現(xiàn)在流行的協(xié)處理器+CPU的架構(gòu)也是這樣的：

3. 服務(wù)器最大并發(fā)數(shù)分析

前面提到的C10K和C10M問題都是圍繞著提升服務(wù)器并發(fā)能力展開的，但是難免要問：服務(wù)器最大的并發(fā)上限是多少？

3.1 五元組

做過通信的盆友們一定聽過五元組這個概念，一個五元組可以唯一標(biāo)記一個網(wǎng)絡(luò)連接，所以要理解和分析最大并發(fā)數(shù)，就必須理解五元組：

這樣的話，就可以基本認(rèn)為：理論最大并發(fā)數(shù) = 服務(wù)端唯一五元組數(shù)。
3.2 端口&IP組合數(shù)

那么對于服務(wù)器來說，服務(wù)端唯一五元組數(shù)最大是多少呢？

有人說是65535，顯然不是，但是之所以會有這類答案是因為當(dāng)前Linux的端口號是2字節(jié)大小的short類型，總計2^16個端口，除去一些系統(tǒng)占用的端口，可用端口確實只剩下64000多了。

對于服務(wù)端本身來說，DestPort數(shù)量確實有限，假定有多張網(wǎng)卡，每個網(wǎng)卡綁定多個IP，服務(wù)端的Port端口數(shù)和IP數(shù)的組合類型也是有限的。

對于客戶端來說，本身的端口和IP也是一樣有限的，雖然這是個組合問題，但是數(shù)量還是有限的：

3.3 并發(fā)數(shù)理論極限

看了前面的端口&IP的組合數(shù)計算，好像并發(fā)數(shù)并不會特別大。

錯了，是真的會很大。

分析一下，前面的計算都是針對單個服務(wù)器或者客戶端的，但是實際上每個服務(wù)器會應(yīng)對全網(wǎng)的所有客戶端，那么從服務(wù)端看，源IP和源Port的數(shù)量是非常大的。

理論上服務(wù)端可以接受的客戶端IP是2^32(按照IPv4計算）,端口數(shù)是2^16，目前端口號仍然是16bit的，所有這個理論最大值是2^48，果然很大！

3.4 實際情況

天下沒有免費(fèi)的午餐。

每一條連接都是要消耗系統(tǒng)資源的，所以實際中可能會設(shè)置最大并發(fā)數(shù)來保證服務(wù)器的安全和穩(wěn)定，所以這個理論最大并發(fā)數(shù)是不可能達(dá)到的。

實際中并發(fā)數(shù)和業(yè)務(wù)是直接相關(guān)的，像redis這種內(nèi)存型的服務(wù)端并發(fā)十幾萬都是沒問題的，大部分來講幾十/幾百/幾千/幾萬等是存在的。

4. 客戶端最大連接數(shù)

理解了服務(wù)器的最大并發(fā)數(shù)是2^48，那么客戶端最多可以連接多少服務(wù)器呢？

對于客戶端來說，當(dāng)然可以借助于多網(wǎng)卡多IP來增加連接能力，我們?nèi)匀患俣蛻舳酥挥?張網(wǎng)卡1個IP，由于端口數(shù)的限制到2^16，再去掉系統(tǒng)占用的端口，剩下可用的差不多64000。

也就是說，客戶端雖然可以連接任意的目的IP和目的端口，但是客戶端自身端口是有限的，所以客戶端的理論最大連接數(shù)是2^16，含系統(tǒng)占用端口。

5. NAT環(huán)境下的客戶端

解決前面的兩個問題之后，來看另外一個問題：

一個公網(wǎng)出口NAT服務(wù)設(shè)備最多可同時支持多少內(nèi)網(wǎng)IP并發(fā)訪問外網(wǎng)服務(wù)？

畢竟公網(wǎng)IP都是有限并且要花錢的，我們大部分機(jī)器都是在局域網(wǎng)中結(jié)合NAT來進(jìn)行外網(wǎng)訪問的，所以這個場景還是很熟悉的。

來看下內(nèi)網(wǎng)機(jī)器訪問外網(wǎng)時的IP&端口替換和映射還原的過程，就明白了：

因為這時的客戶端是NAT設(shè)備，所以NAT環(huán)境下最多支持65535個并發(fā)訪問外網(wǎng)。

6.小結(jié)

本文通過一道面試題切入，先描述了C10K和C10M問題，進(jìn)而詳細(xì)說明了客戶端的最大訪問數(shù)和服務(wù)端的最大并發(fā)數(shù)計算和原理，最后描述了NAT場景下的訪問并發(fā)數(shù)。

雖然理論服務(wù)端并發(fā)數(shù)非常大，但是我們也沒有必要覺得并發(fā)數(shù)高就厲害，服務(wù)復(fù)雜程度不一樣，切忌唯并發(fā)數(shù)來判斷業(yè)務(wù)和開發(fā)者水平。

試想echo服務(wù)和訂單交易服務(wù)顯然是不一樣的，我們應(yīng)該做的是在服務(wù)穩(wěn)定和高可用的前提下去從緩存/網(wǎng)絡(luò)/數(shù)據(jù)庫等多個角度來優(yōu)化提高性能。

對了，在這里說一下，我目前是在職JAVA開發(fā)，如果你現(xiàn)在正在學(xué)習(xí)Java，了解Java，渴望成為一名合格的Java開發(fā)工程師，在入門學(xué)習(xí)Java的過程當(dāng)中缺乏基礎(chǔ)入門的視頻教程，可以關(guān)注并私信我：01。獲取。我這里有最新的Java基礎(chǔ)全套視頻教程。