發(fā)展史
1、很久很久以前,Web 基本上就是文檔的瀏覽而已, 既然是瀏覽,作為服務(wù)器, 不需要記錄誰(shuí)在某一段時(shí)間里都瀏覽了什么文檔,每次請(qǐng)求都是一個(gè)新的HTTP協(xié)議, 就是請(qǐng)求加響應(yīng), 尤其是我不用記住是誰(shuí)剛剛發(fā)了HTTP請(qǐng)求, 每個(gè)請(qǐng)求對(duì)我來(lái)說都是全新的。這段時(shí)間很嗨皮。
2、但是隨著交互式Web應(yīng)用的興起,像在線購(gòu)物網(wǎng)站,需要登錄的網(wǎng)站等等,馬上就面臨一個(gè)問題,那就是要管理會(huì)話,必須記住哪些人登錄系統(tǒng), 哪些人往自己的購(gòu)物車中放商品, 也就是說我必須把每個(gè)人區(qū)分開,這就是一個(gè)不小的挑戰(zhàn),因?yàn)镠TTP請(qǐng)求是無(wú)狀態(tài)的,所以想出的辦法就是給大家發(fā)一個(gè)會(huì)話標(biāo)識(shí)(session id), 說白了就是一個(gè)隨機(jī)的字串,每個(gè)人收到的都不一樣, 每次大家向我發(fā)起HTTP請(qǐng)求的時(shí)候,把這個(gè)字符串給一并捎過來(lái), 這樣我就能區(qū)分開誰(shuí)是誰(shuí)了
3、這樣大家很嗨皮了,可是服務(wù)器就不嗨皮了,每個(gè)人只需要保存自己的session id,而服務(wù)器要保存所有人的session id !如果訪問服務(wù)器多了, 就得由成千上萬(wàn),甚至幾十萬(wàn)個(gè)。
這對(duì)服務(wù)器說是一個(gè)巨大的開銷 , 嚴(yán)重的限制了服務(wù)器擴(kuò)展能力, 比如說我用兩個(gè)機(jī)器組成了一個(gè)集群, 小F通過機(jī)器A登錄了系統(tǒng), 那session id會(huì)保存在機(jī)器A上, 假設(shè)小F的下一次請(qǐng)求被轉(zhuǎn)發(fā)到機(jī)器B怎么辦?機(jī)器B可沒有小F的 session id啊。
有時(shí)候會(huì)采用一點(diǎn)小伎倆: session sticky , 就是讓小F的請(qǐng)求一直粘連在機(jī)器A上, 但是這也不管用, 要是機(jī)器A掛掉了, 還得轉(zhuǎn)到機(jī)器B去。
那只好做session 的復(fù)制了, 把session id 在兩個(gè)機(jī)器之間搬來(lái)搬去, 快累死了。
后來(lái)有個(gè)叫Memcached的支了招:把session id 集中存儲(chǔ)到一個(gè)地方, 所有的機(jī)器都來(lái)訪問這個(gè)地方的數(shù)據(jù), 這樣一來(lái),就不用復(fù)制了, 但是增加了單點(diǎn)失敗的可能性, 要是那個(gè)負(fù)責(zé)session 的機(jī)器掛了, 所有人都得重新登錄一遍, 估計(jì)得被人罵死。
也嘗試把這個(gè)單點(diǎn)的機(jī)器也搞出集群,增加可靠性, 但不管如何, 這小小的session 對(duì)我來(lái)說是一個(gè)沉重的負(fù)擔(dān)
4、于是有人就一直在思考, 我為什么要保存這可惡的session呢, 只讓每個(gè)客戶端去保存該多好?
可是如果不保存這些session id , 怎么驗(yàn)證客戶端發(fā)給我的session id 的確是我生成的呢?如果不去驗(yàn)證,我們都不知道他們是不是合法登錄的用戶, 那些不懷好意的家伙們就可以偽造session id , 為所欲為了。
嗯,對(duì)了,關(guān)鍵點(diǎn)就是驗(yàn)證 !
比如說, 小F已經(jīng)登錄了系統(tǒng), 我給他發(fā)一個(gè)令牌(token), 里邊包含了小F的 user id, 下一次小F 再次通過Http 請(qǐng)求訪問我的時(shí)候, 把這個(gè)token 通過Http header 帶過來(lái)不就可以了。
不過這和session id沒有本質(zhì)區(qū)別啊, 任何人都可以可以偽造, 所以我得想點(diǎn)兒辦法, 讓別人偽造不了。
那就對(duì)數(shù)據(jù)做一個(gè)簽名吧, 比如說我用Hmac-SHA256 算法,加上一個(gè)只有我才知道的密鑰, 對(duì)數(shù)據(jù)做一個(gè)簽名, 把這個(gè)簽名和數(shù)據(jù)一起作為token , 由于密鑰別人不知道, 就無(wú)法偽造token了。
這個(gè)token 我不保存, 當(dāng)小F把這個(gè)token 給我發(fā)過來(lái)的時(shí)候,我再用同樣的HMAC-SHA256 算法和同樣的密鑰,對(duì)數(shù)據(jù)再計(jì)算一次簽名, 和token 中的簽名做個(gè)比較, 如果相同, 我就知道小F已經(jīng)登錄過了,并且可以直接取到小F的user id , 如果不相同, 數(shù)據(jù)部分肯定被人篡改過, 我就告訴發(fā)送者:對(duì)不起,沒有認(rèn)證。
Token 中的數(shù)據(jù)是明文保存的(雖然我會(huì)用Base64做下編碼, 但那不是加密), 還是可以被別人看到的, 所以我不能在其中保存像密碼這樣的敏感信息。
當(dāng)然, 如果一個(gè)人的token 被別人偷走了, 那我也沒辦法, 我也會(huì)認(rèn)為小偷就是合法用戶, 這其實(shí)和一個(gè)人的session id 被別人偷走是一樣的。
這樣一來(lái), 我就不保存session id 了, 我只是生成token , 然后驗(yàn)證token , 我用我的CPU計(jì)算時(shí)間獲取了我的session 存儲(chǔ)空間 !
解除了session id這個(gè)負(fù)擔(dān), 可以說是無(wú)事一身輕, 我的機(jī)器集群現(xiàn)在可以輕松地做水平擴(kuò)展, 用戶訪問量增大, 直接加機(jī)器就行。這種無(wú)狀態(tài)的感覺實(shí)在是太好了!
Cookie
cookie 是一個(gè)非常具體的東西,指的就是瀏覽器里面能永久存儲(chǔ)的一種數(shù)據(jù),僅僅是瀏覽器實(shí)現(xiàn)的一種數(shù)據(jù)存儲(chǔ)功能。
cookie由服務(wù)器生成,發(fā)送給瀏覽器,瀏覽器把cookie以kv形式保存到某個(gè)目錄下的文本文件內(nèi),下一次請(qǐng)求同一網(wǎng)站時(shí)會(huì)把該cookie發(fā)送給服務(wù)器。由于cookie是存在客戶端上的,所以瀏覽器加入了一些限制確保cookie不會(huì)被惡意使用,同時(shí)不會(huì)占據(jù)太多磁盤空間,所以每個(gè)域的cookie數(shù)量是有限的。
Session
session 從字面上講,就是會(huì)話。這個(gè)就類似于你和一個(gè)人交談,你怎么知道當(dāng)前和你交談的是張三而不是李四呢?對(duì)方肯定有某種特征(長(zhǎng)相等)表明他就是張三。
session 也是類似的道理,服務(wù)器要知道當(dāng)前發(fā)請(qǐng)求給自己的是誰(shuí)。為了做這種區(qū)分,服務(wù)器就要給每個(gè)客戶端分配不同的“身份標(biāo)識(shí)”,然后客戶端每次向服務(wù)器發(fā)請(qǐng)求的時(shí)候,都帶上這個(gè)“身份標(biāo)識(shí)”,服務(wù)器就知道這個(gè)請(qǐng)求來(lái)自于誰(shuí)了。至于客戶端怎么保存這個(gè)“身份標(biāo)識(shí)”,可以有很多種方式,對(duì)于瀏覽器客戶端,大家都默認(rèn)采用 cookie 的方式。
服務(wù)器使用session把用戶的信息臨時(shí)保存在了服務(wù)器上,用戶離開網(wǎng)站后session會(huì)被銷毀。這種用戶信息存儲(chǔ)方式相對(duì)cookie來(lái)說更安全,可是session有一個(gè)缺陷:如果web服務(wù)器做了負(fù)載均衡,那么下一個(gè)操作請(qǐng)求到了另一臺(tái)服務(wù)器的時(shí)候session會(huì)丟失。
Token
在Web領(lǐng)域基于Token的身份驗(yàn)證隨處可見。在大多數(shù)使用Web API的互聯(lián)網(wǎng)公司中,tokens 是多用戶下處理認(rèn)證的最佳方式。
以下幾點(diǎn)特性會(huì)讓你在程序中使用基于Token的身份驗(yàn)證
- 無(wú)狀態(tài)、可擴(kuò)展
- 支持移動(dòng)設(shè)備
- 跨程序調(diào)用
- 安全
那些使用基于Token的身份驗(yàn)證的大佬們
大部分你見到過的API和Web應(yīng)用都使用tokens。例如Facebook, Twitter, google+, GitHub等。
Token的起源
在介紹基于Token的身份驗(yàn)證的原理與優(yōu)勢(shì)之前,不妨先看看之前的認(rèn)證都是怎么做的。
基于服務(wù)器的驗(yàn)證
我們都是知道HTTP協(xié)議是無(wú)狀態(tài)的,這種無(wú)狀態(tài)意味著程序需要驗(yàn)證每一次請(qǐng)求,從而辨別客戶端的身份。
在這之前,程序都是通過在服務(wù)端存儲(chǔ)的登錄信息來(lái)辨別請(qǐng)求的。這種方式一般都是通過存儲(chǔ)Session來(lái)完成。
隨著Web,應(yīng)用程序,已經(jīng)移動(dòng)端的興起,這種驗(yàn)證的方式逐漸暴露出了問題。尤其是在可擴(kuò)展性方面。
基于服務(wù)器驗(yàn)證方式暴露的一些問題
- Seesion:每次認(rèn)證用戶發(fā)起請(qǐng)求時(shí),服務(wù)器需要去創(chuàng)建一個(gè)記錄來(lái)存儲(chǔ)信息。當(dāng)越來(lái)越多的用戶發(fā)請(qǐng)求時(shí),內(nèi)存的開銷也會(huì)不斷增加。
- 可擴(kuò)展性:在服務(wù)端的內(nèi)存中使用Seesion存儲(chǔ)登錄信息,伴隨而來(lái)的是可擴(kuò)展性問題。
- CORS(跨域資源共享):當(dāng)我們需要讓數(shù)據(jù)跨多臺(tái)移動(dòng)設(shè)備上使用時(shí),跨域資源的共享會(huì)是一個(gè)讓人頭疼的問題。在使用Ajax抓取另一個(gè)域的資源,就可以會(huì)出現(xiàn)禁止請(qǐng)求的情況。
- CSRF(跨站請(qǐng)求偽造):用戶在訪問銀行網(wǎng)站時(shí),他們很容易受到跨站請(qǐng)求偽造的攻擊,并且能夠被利用其訪問其他的網(wǎng)站。
在這些問題中,可擴(kuò)展行是最突出的。因此我們有必要去尋求一種更有行之有效的方法。
基于Token的驗(yàn)證原理
基于Token的身份驗(yàn)證是無(wú)狀態(tài)的,我們不將用戶信息存在服務(wù)器或Session中。
這種概念解決了在服務(wù)端存儲(chǔ)信息時(shí)的許多問題
NoSession意味著你的程序可以根據(jù)需要去增減機(jī)器,而不用去擔(dān)心用戶是否登錄。
基于Token的身份驗(yàn)證的過程如下:
- 用戶通過用戶名和密碼發(fā)送請(qǐng)求。
- 程序驗(yàn)證。
- 程序返回一個(gè)簽名的token 給客戶端。
- 客戶端儲(chǔ)存token,并且每次用于每次發(fā)送請(qǐng)求。
- 服務(wù)端驗(yàn)證token并返回?cái)?shù)據(jù)。
每一次請(qǐng)求都需要token。token應(yīng)該在HTTP的頭部發(fā)送從而保證了Http請(qǐng)求無(wú)狀態(tài)。我們同樣通過設(shè)置服務(wù)器屬性Access-Control-Allow-Origin:* ,讓服務(wù)器能接受到來(lái)自所有域的請(qǐng)求。
需要主要的是,在ACAO頭部標(biāo)明(designating)*時(shí),不得帶有像HTTP認(rèn)證,客戶端SSL證書和cookies的證書。
實(shí)現(xiàn)思路:
- 用戶登錄校驗(yàn),校驗(yàn)成功后就返回Token給客戶端。
- 客戶端收到數(shù)據(jù)后保存在客戶端
- 客戶端每次訪問API是攜帶Token到服務(wù)器端。
- 服務(wù)器端采用filter過濾器校驗(yàn)。校驗(yàn)成功則返回請(qǐng)求數(shù)據(jù),校驗(yàn)失敗則返回錯(cuò)誤碼
當(dāng)我們?cè)诔绦蛑姓J(rèn)證了信息并取得token之后,我們便能通過這個(gè)Token做許多的事情。
我們甚至能基于創(chuàng)建一個(gè)基于權(quán)限的token傳給第三方應(yīng)用程序,這些第三方程序能夠獲取到我們的數(shù)據(jù)(當(dāng)然只有在我們?cè)试S的特定的token)
Tokens的優(yōu)勢(shì)
無(wú)狀態(tài)、可擴(kuò)展
在客戶端存儲(chǔ)的Tokens是無(wú)狀態(tài)的,并且能夠被擴(kuò)展。基于這種無(wú)狀態(tài)和不存儲(chǔ)Session信息,負(fù)載負(fù)載均衡器能夠?qū)⒂脩粜畔囊粋€(gè)服務(wù)傳到其他服務(wù)器上。
如果我們將已驗(yàn)證的用戶的信息保存在Session中,則每次請(qǐng)求都需要用戶向已驗(yàn)證的服務(wù)器發(fā)送驗(yàn)證信息(稱為Session親和性)。用戶量大時(shí),可能會(huì)造成一些擁堵。
但是不要著急。使用tokens之后這些問題都迎刃而解,因?yàn)閠okens自己hold住了用戶的驗(yàn)證信息。
安全性
請(qǐng)求中發(fā)送token而不再是發(fā)送cookie能夠防止CSRF(跨站請(qǐng)求偽造)。即使在客戶端使用cookie存儲(chǔ)token,cookie也僅僅是一個(gè)存儲(chǔ)機(jī)制而不是用于認(rèn)證。不將信息存儲(chǔ)在Session中,讓我們少了對(duì)session操作。
token是有時(shí)效的,一段時(shí)間之后用戶需要重新驗(yàn)證。我們也不一定需要等到token自動(dòng)失效,token有撤回的操作,通過token revocataion可以使一個(gè)特定的token或是一組有相同認(rèn)證的token無(wú)效。
可擴(kuò)展性
Tokens能夠創(chuàng)建與其它程序共享權(quán)限的程序。例如,能將一個(gè)隨便的社交帳號(hào)和自己的大號(hào)(Fackbook或是Twitter)聯(lián)系起來(lái)。當(dāng)通過服務(wù)登錄Twitter(我們將這個(gè)過程Buffer)時(shí),我們可以將這些Buffer附到Twitter的數(shù)據(jù)流上(we are allowing Buffer to post to our Twitter stream)。
使用tokens時(shí),可以提供可選的權(quán)限給第三方應(yīng)用程序。當(dāng)用戶想讓另一個(gè)應(yīng)用程序訪問它們的數(shù)據(jù),我們可以通過建立自己的API,得出特殊權(quán)限的tokens。
多平臺(tái)跨域
我們提前先來(lái)談?wù)撘幌翪ORS(跨域資源共享),對(duì)應(yīng)用程序和服務(wù)進(jìn)行擴(kuò)展的時(shí)候,需要介入各種各種的設(shè)備和應(yīng)用程序。
Having our API just serve data, we can also make the design choice to serve assets from a CDN. This eliminates the issues that CORS brings up after we set a quick header configuration for our Application.
只要用戶有一個(gè)通過了驗(yàn)證的token,數(shù)據(jù)和資源就能夠在任何域上被請(qǐng)求到。
Access-Control-Allow-Origin: *
基于標(biāo)準(zhǔn)創(chuàng)建token的時(shí)候,你可以設(shè)定一些選項(xiàng)。我們?cè)诤罄m(xù)的文章中會(huì)進(jìn)行更加詳盡的描述,但是標(biāo)準(zhǔn)的用法會(huì)在JSON Web Tokens體現(xiàn)。
最近的程序和文檔是供給JSON Web Tokens的。它支持眾多的語(yǔ)言。這意味在未來(lái)的使用中你可以真正的轉(zhuǎn)換你的認(rèn)證機(jī)制。
作者:墨顏丶