想必大家一定聽說過 Nginx,若沒聽說過它,那么一定聽過它的"同行"Apache 吧!
Nginx 同 Apache 一樣都是一種 Web 服務(wù)器。基于 REST 架構(gòu)風(fēng)格,以統(tǒng)一資源描述符(Uniform Resources Identifier)URI 或者統(tǒng)一資源定位符(Uniform Resources Locator)URL 作為溝通依據(jù),通過 HTTP 協(xié)議提供各種網(wǎng)絡(luò)服務(wù)。
然而,這些服務(wù)器在設(shè)計(jì)之初受到當(dāng)時(shí)環(huán)境的局限,例如當(dāng)時(shí)的用戶規(guī)模,網(wǎng)絡(luò)帶寬,產(chǎn)品特點(diǎn)等局限并且各自的定位和發(fā)展都不盡相同。這也使得各個(gè) Web 服務(wù)器有著各自鮮明的特點(diǎn)。
Apache 的發(fā)展時(shí)期很長,而且是毫無爭議的世界第一大服務(wù)器。它有著很多優(yōu)點(diǎn):穩(wěn)定、開源、跨平臺(tái)等等。
它出現(xiàn)的時(shí)間太長了,它興起的年代,互聯(lián)網(wǎng)產(chǎn)業(yè)遠(yuǎn)遠(yuǎn)比不上現(xiàn)在。所以它被設(shè)計(jì)為一個(gè)重量級(jí)的。
它不支持高并發(fā)的服務(wù)器。在 Apache 上運(yùn)行數(shù)以萬計(jì)的并發(fā)訪問,會(huì)導(dǎo)致服務(wù)器消耗大量內(nèi)存。
操作系統(tǒng)對其進(jìn)行進(jìn)程或線程間的切換也消耗了大量的 CPU 資源,導(dǎo)致 HTTP 請求的平均響應(yīng)速度降低。
這些都決定了 Apache 不可能成為高性能 Web 服務(wù)器,輕量級(jí)高并發(fā)服務(wù)器 Nginx 就應(yīng)運(yùn)而生了。
俄羅斯的工程師 Igor Sysoev,他在為 Rambler Media 工作期間,使用 C 語言開發(fā)了 Nginx。
Nginx 作為 Web 服務(wù)器一直為 Rambler Media 提供出色而又穩(wěn)定的服務(wù)。然后呢,Igor Sysoev 將 Nginx 代碼開源,并且賦予自由軟件許可證。
由于以下這幾點(diǎn),所以,Nginx 火了:
-
Nginx 使用基于事件驅(qū)動(dòng)架構(gòu),使得其可以支持?jǐn)?shù)以百萬級(jí)別的 TCP 連接。
-
高度的模塊化和自由軟件許可證使得第三方模塊層出不窮(這是個(gè)開源的時(shí)代啊)。
-
Nginx 是一個(gè)跨平臺(tái)服務(wù)器,可以運(yùn)行在 linux、windows、FreeBSD、Solaris、AIX、mac OS 等操作系統(tǒng)上。
-
這些優(yōu)秀的設(shè)計(jì)帶來的極大的穩(wěn)定性。
Nginx 是一款自由的、開源的、高性能的 HTTP 服務(wù)器和反向代理服務(wù)器;同時(shí)也是一個(gè) IMAP、POP3、SMTP 代理服務(wù)器。
Nginx 可以作為一個(gè) HTTP 服務(wù)器進(jìn)行網(wǎng)站的發(fā)布處理,另外 Nginx 可以作為反向代理進(jìn)行負(fù)載均衡的實(shí)現(xiàn)。
說到代理,首先我們要明確一個(gè)概念,所謂代理就是一個(gè)代表、一個(gè)渠道;此時(shí)就涉及到兩個(gè)角色,一個(gè)是被代理角色,一個(gè)是目標(biāo)角色。
被代理角色通過這個(gè)代理訪問目標(biāo)角色完成一些任務(wù)的過程稱為代理操作過程;如同生活中的專賣店,客人到 adidas 專賣店買了一雙鞋,這個(gè)專賣店就是代理,被代理角色就是 adidas 廠家,目標(biāo)角色就是用戶。
說反向代理之前,我們先看看正向代理,正向代理也是大家最常接觸到的代理模式,我們會(huì)從兩個(gè)方面來說關(guān)于正向代理的處理模式,分別從軟件方面和生活方面來解釋一下什么叫正向代理。
在如今的網(wǎng)絡(luò)環(huán)境下,我們?nèi)绻捎诩夹g(shù)需要要去訪問國外的某些網(wǎng)站,此時(shí)你會(huì)發(fā)現(xiàn)位于國外的某網(wǎng)站我們通過瀏覽器是沒有辦法訪問的。
此時(shí)大家可能都會(huì)用一個(gè)操作 FQ 進(jìn)行訪問,F(xiàn)Q 的方式主要是找到一個(gè)可以訪問國外網(wǎng)站的代理服務(wù)器,我們將請求發(fā)送給代理服務(wù)器,代理服務(wù)器去訪問國外的網(wǎng)站,然后將訪問到的數(shù)據(jù)傳遞給我們!
上述這樣的代理模式稱為正向代理,正向代理最大的特點(diǎn)是客戶端非常明確要訪問的服務(wù)器地址;服務(wù)器只清楚請求來自哪個(gè)代理服務(wù)器,而不清楚來自哪個(gè)具體的客戶端;正向代理模式屏蔽或者隱藏了真實(shí)客戶端信息。
來看個(gè)示意圖(我把客戶端和正向代理框在一塊,同屬于一個(gè)環(huán)境,后面我有介紹):
客戶端必須設(shè)置正向代理服務(wù)器,當(dāng)然前提是要知道正向代理服務(wù)器的 IP 地址,還有代理程序的端口。
如下圖:
總結(jié)來說:正向代理,"它代理的是客戶端",是一個(gè)位于客戶端和原始服務(wù)器(Origin Server)之間的服務(wù)器,為了從原始服務(wù)器取得內(nèi)容,客戶端向代理發(fā)送一個(gè)請求并指定目標(biāo)(原始服務(wù)器)。
然后代理向原始服務(wù)器轉(zhuǎn)交請求并將獲得的內(nèi)容返回給客戶端。客戶端必須要進(jìn)行一些特別的設(shè)置才能使用正向代理。
反向代理
明白了什么是正向代理,我們繼續(xù)看關(guān)于反向代理的處理方式,舉例如我國的某寶網(wǎng)站,每天同時(shí)連接到網(wǎng)站的訪問人數(shù)已經(jīng)爆表,單個(gè)服務(wù)器遠(yuǎn)遠(yuǎn)不能滿足人民日益增長的購買欲望了。
此時(shí)就出現(xiàn)了一個(gè)大家耳熟能詳?shù)拿~:分布式部署;也就是通過部署多臺(tái)服務(wù)器來解決訪問人數(shù)限制的問題。
某寶網(wǎng)站中大部分功能也是直接使用 Nginx 進(jìn)行反向代理實(shí)現(xiàn)的,并且通過封裝 Nginx 和其他的組件之后起了個(gè)高大上的名字:Tengine。
有興趣的童鞋可以訪問 Tengine 的官網(wǎng)查看具體的信息:
http://tengine.taobao.org/
那么反向代理具體是通過什么樣的方式實(shí)現(xiàn)的分布式的集群操作呢,我們先看一個(gè)示意圖(我把服務(wù)器和反向代理框在一塊,同屬于一個(gè)環(huán)境,后面我有介紹):
通過上述的圖解大家就可以看清楚了,多個(gè)客戶端給服務(wù)器發(fā)送的請求,Nginx 服務(wù)器接收到之后,按照一定的規(guī)則分發(fā)給了后端的業(yè)務(wù)處理服務(wù)器進(jìn)行處理了。
此時(shí)請求的來源也就是客戶端是明確的,但是請求具體由哪臺(tái)服務(wù)器處理的并不明確了,Nginx 扮演的就是一個(gè)反向代理角色。
客戶端是無感知代理的存在的,反向代理對外都是透明的,訪問者并不知道自己訪問的是一個(gè)代理。因?yàn)榭蛻舳瞬恍枰魏闻渲镁涂梢栽L問。
反向代理,"它代理的是服務(wù)端",主要用于服務(wù)器集群分布式部署的情況下,反向代理隱藏了服務(wù)器的信息。
通常情況下,我們在實(shí)際項(xiàng)目操作時(shí),正向代理和反向代理很有可能會(huì)存在同一個(gè)應(yīng)用場景中,正向代理代理客戶端的請求去訪問目標(biāo)服務(wù)器,目標(biāo)服務(wù)器是一個(gè)反向代理服務(wù)器,反向代理了多臺(tái)真實(shí)的業(yè)務(wù)處理服務(wù)器。
具體的拓?fù)鋱D如下:
截了一張圖來說明正向代理和反向代理二者之間的區(qū)別,如下圖:
實(shí)際上,Proxy 在兩種代理中做的事情都是替服務(wù)器代為收發(fā)請求和響應(yīng),不過從結(jié)構(gòu)上看正好左右互換了一下,所以把后出現(xiàn)的那種代理方式稱為反向代理了。
我們已經(jīng)明確了所謂代理服務(wù)器的概念,那么接下來,Nginx 扮演了反向代理服務(wù)器的角色,它是依據(jù)什么樣的規(guī)則進(jìn)行請求分發(fā)的呢?不用的項(xiàng)目應(yīng)用場景,分發(fā)的規(guī)則是否可以控制呢?
這里提到的客戶端發(fā)送的、Nginx 反向代理服務(wù)器接收到的請求數(shù)量,就是我們說的負(fù)載量。
請求數(shù)量按照一定的規(guī)則進(jìn)行分發(fā),到不同的服務(wù)器處理的規(guī)則,就是一種均衡規(guī)則。
所以將服務(wù)器接收到的請求按照規(guī)則分發(fā)的過程,稱為負(fù)載均衡。
負(fù)載均衡在實(shí)際項(xiàng)目操作過程中,有硬件負(fù)載均衡和軟件負(fù)載均衡兩種,硬件負(fù)載均衡也稱為硬負(fù)載,如 F5 負(fù)載均衡,相對造價(jià)昂貴成本較高。
但是數(shù)據(jù)的穩(wěn)定性安全性等等有非常好的保障,如中國移動(dòng)中國聯(lián)通這樣的公司才會(huì)選擇硬負(fù)載進(jìn)行操作。
更多的公司考慮到成本原因,會(huì)選擇使用軟件負(fù)載均衡,軟件負(fù)載均衡是利用現(xiàn)有的技術(shù)結(jié)合主機(jī)硬件實(shí)現(xiàn)的一種消息隊(duì)列分發(fā)機(jī)制。
Nginx 支持的負(fù)載均衡調(diào)度算法方式如下:
①weight 輪詢(默認(rèn)):接收到的請求按照順序逐一分配到不同的后端服務(wù)器,即使在使用過程中,某一臺(tái)后端服務(wù)器宕機(jī),Nginx 會(huì)自動(dòng)將該服務(wù)器剔除出隊(duì)列,請求受理情況不會(huì)受到任何影響。
這種方式下,可以給不同的后端服務(wù)器設(shè)置一個(gè)權(quán)重值(weight),用于調(diào)整不同的服務(wù)器上請求的分配率。
權(quán)重?cái)?shù)據(jù)越大,被分配到請求的幾率越大;該權(quán)重值,主要是針對實(shí)際工作環(huán)境中不同的后端服務(wù)器硬件配置進(jìn)行調(diào)整的。
②ip_hash:每個(gè)請求按照發(fā)起客戶端的 ip 的 hash 結(jié)果進(jìn)行匹配,這樣的算法下一個(gè)固定 ip 地址的客戶端總會(huì)訪問到同一個(gè)后端服務(wù)器,這也在一定程度上解決了集群部署環(huán)境下 Session 共享的問題。
③fair:智能調(diào)整調(diào)度算法,動(dòng)態(tài)的根據(jù)后端服務(wù)器的請求處理到響應(yīng)的時(shí)間進(jìn)行均衡分配。
響應(yīng)時(shí)間短處理效率高的服務(wù)器分配到請求的概率高,響應(yīng)時(shí)間長處理效率低的服務(wù)器分配到的請求少,它是結(jié)合了前兩者的優(yōu)點(diǎn)的一種調(diào)度算法。
但是需要注意的是 Nginx 默認(rèn)不支持 fair 算法,如果要使用這種調(diào)度算法,請安裝 upstream_fair 模塊。
④url_hash:按照訪問的 URL 的 hash 結(jié)果分配請求,每個(gè)請求的 URL 會(huì)指向后端固定的某個(gè)服務(wù)器,可以在 Nginx 作為靜態(tài)服務(wù)器的情況下提高緩存效率。
同樣要注意 Nginx 默認(rèn)不支持這種調(diào)度算法,要使用的話需要安裝 Nginx 的 hash 軟件包。