從狀態說起
原文:「鏈接」
我們知道,HTTP 是無狀態的。也就是說,HTTP 請求方和響應方之間無法維護狀態,都是一次性的,它不知道前后的請求都發生了什么。
但有的場景下,我們需要維護狀態。最典型的,一個用戶登陸微博,發布、關注、評論,都應該是在登錄后的用戶狀態下的。
「前端存儲」
這就涉及到一發、一存、一帶,發好辦,登陸接口直接返回給前端,存儲就需要前端想辦法了。
前端的存儲方式有很多。
- 最矬的,掛到全局變量上,但這是個「體驗卡」,一次刷新頁面就沒了
- 高端點的,存到 cookie、localStorage 等里,這屬于「會員卡」,無論怎么刷新,只要瀏覽器沒清掉或者過期,就一直拿著這個狀態。
前端存儲這里不展開了。
有地方存了,請求的時候就可以拼到參數里帶給接口了。
基石:cookie
cookie 也是前端存儲的一種,但相比于 localStorage 等其他方式,借助 HTTP 頭、瀏覽器能力,cookie 可以做到前端無感知。
一般過程是這樣的:
- 在提供標記的接口,通過 HTTP 返回頭的 Set-Cookie 字段,直接「種」到瀏覽器上
- 瀏覽器發起請求時,會自動把 cookie 通過 HTTP 請求頭的 Cookie 字段,帶給接口
「配置:Domain / Path」
Domain屬性指定瀏覽器發出 HTTP 請求時,哪些域名要附帶這個 Cookie。如果沒有指定該屬性,瀏覽器會默認將其設為當前 URL 的一級域名,比如 www.example.com 會設為 example.com,而且以后如果訪問example.com的任何子域名,HTTP 請求也會帶上這個 Cookie。如果服務器在Set-Cookie字段指定的域名,不屬于當前域名,瀏覽器會拒絕這個 Cookie。
Path屬性指定瀏覽器發出 HTTP 請求時,哪些路徑要附帶這個 Cookie。只要瀏覽器發現,Path屬性是 HTTP 請求路徑的開頭一部分,就會在頭信息里面帶上這個 Cookie。比如,PATH屬性是/,那么請求/docs路徑也會包含該 Cookie。當然,前提是域名必須一致。
—— Cookie — JAVAScript 標準參考教程(alpha)
「配置:Expires / Max-Age」
Expires屬性指定一個具體的到期時間,到了指定時間以后,瀏覽器就不再保留這個 Cookie。它的值是 UTC 格式。如果不設置該屬性,或者設為null,Cookie 只在當前會話(session)有效,瀏覽器窗口一旦關閉,當前 Session 結束,該 Cookie 就會被刪除。另外,瀏覽器根據本地時間,決定 Cookie 是否過期,由于本地時間是不精確的,所以沒有辦法保證 Cookie 一定會在服務器指定的時間過期。
Max-Age屬性指定從現在開始 Cookie 存在的秒數,比如60 * 60 * 24 * 365(即一年)。過了這個時間以后,瀏覽器就不再保留這個 Cookie。
如果同時指定了Expires和Max-Age,那么Max-Age的值將優先生效。
如果Set-Cookie字段沒有指定Expires或Max-Age屬性,那么這個 Cookie 就是 Session Cookie,即它只在本次對話存在,一旦用戶關閉瀏覽器,瀏覽器就不會再保留這個 Cookie。
—— Cookie — JavaScript 標準參考教程(alpha)
「配置:Secure / HttpOnly」
Secure屬性指定瀏覽器只有在加密協議 HTTPS 下,才能將這個 Cookie 發送到服務器。另一方面,如果當前協議是 HTTP,瀏覽器會自動忽略服務器發來的Secure屬性。該屬性只是一個開關,不需要指定值。如果通信是 HTTPS 協議,該開關自動打開。
HttpOnly屬性指定該 Cookie 無法通過 JavaScript 腳本拿到,主要是Document.cookie屬性、XMLHttpRequest對象和 Request API 都拿不到該屬性。這樣就防止了該 Cookie 被腳本讀到,只有瀏覽器發出 HTTP 請求時,才會帶上該 Cookie。
—— Cookie — JavaScript 標準參考教程(alpha)
「HTTP 頭對 cookie 的讀寫」
回過頭來,HTTP 是如何寫入和傳遞 cookie 及其配置的呢?
HTTP 返回的一個 Set-Cookie 頭用于向瀏覽器寫入「一條(且只能是一條)」cookie,格式為 cookie 鍵值 + 配置鍵值。例如:
Set-Cookie: username=jimu; domain=jimu.com; path=/blog; Expires=Wed, 21 Oct 2015 07:28:00 GMT; Secure; HttpOnly
那我想一次多 set 幾個 cookie 怎么辦?多給幾個 Set-Cookie 頭(一次 HTTP 請求中允許重復)
Set-Cookie: username=jimu; domain=jimu.com
Set-Cookie: height=180; domain=me.jimu.com
Set-Cookie: weight=80; domain=me.jimu.com
HTTP 請求的 Cookie 頭用于瀏覽器把符合當前「空間、時間、使用方式」配置的所有 cookie 一并發給服務端。因為由瀏覽器做了篩選判斷,就不需要歸還配置內容了,只要發送鍵值就可以。
Cookie: username=jimu; height=180; weight=80
「前端對 cookie 的讀寫」
前端可以自己創建 cookie,如果服務端創建的 cookie 沒加HttpOnly,那恭喜你也可以修改他給的 cookie。
調用document.cookie可以創建、修改 cookie,和 HTTP 一樣,一次document.cookie能且只能操作一個 cookie。
document.cookie = 'username=jimu; domain=jimu.com; path=/blog; Expires=Wed, 21 Oct 2015 07:28:00 GMT; Secure; HttpOnly';
調用document.cookie也可以讀到 cookie,也和 HTTP 一樣,能讀到所有的非HttpOnlycookie。
console.log(document.cookie);
// username=jimu; height=180; weight=80
(就一個 cookie 屬性,為什么讀寫行為不一樣?get / set 了解下)
「cookie 是維持 HTTP 請求狀態的基石」
了解了 cookie 后,我們知道 cookie 是最便捷的維持 HTTP 請求狀態的方式,大多數前端鑒權問題都是靠 cookie 解決的。當然也可以選用別的存儲方式(后面也會多多少少提到)。
那有了存儲工具,接下來怎么做呢?
應用方案:服務端 session
現在回想下,你刷卡的時候發生了什么?
其實你的卡上只存了一個 id(可能是你的學號),刷的時候物業系統去查你的信息、賬戶,再決定「這個門你能不能進」「這個雞腿去哪個賬戶扣錢」。
這種操作,在前后端鑒權系統中,叫 session。
典型的 session 登陸/驗證流程:
- 瀏覽器登錄發送賬號密碼,服務端查用戶庫,校驗用戶
- 服務端把用戶登錄狀態存為 Session,生成一個 sessionId
- 通過登錄接口返回,把 sessionId set 到 cookie 上
- 此后瀏覽器再請求業務接口,sessionId 隨 cookie 帶上
- 服務端查 sessionId 校驗 session
- 成功后正常做業務處理,返回結果
「Session 的存儲方式」
顯然,服務端只是給 cookie 一個 sessionId,而 session 的具體內容(可能包含用戶信息、session 狀態等),要自己存一下。存儲的方式有幾種:
- redis(推薦):內存型數據庫,redis中文官方網站。以 key-value 的形式存,正合 sessionId-sessionData 的場景;且訪問快。
- 內存:直接放到變量里。一旦服務重啟就沒了
- 數據庫:普通數據庫。性能不高。
「Session 的過期和銷毀」
很簡單,只要把存儲的 session 數據銷毀就可以。
「Session 的分布式問題」
通常服務端是集群,而用戶請求過來會走一次負載均衡,不一定打到哪臺機器上。那一旦用戶后續接口請求到的機器和他登錄請求的機器不一致,或者登錄請求的機器宕機了,session 不就失效了嗎?
這個問題現在有幾種解決方式。
- 一是從「存儲」角度,把 session 集中存儲。如果我們用獨立的 Redis 或普通數據庫,就可以把 session 都存到一個庫里。
- 二是從「分布」角度,讓相同 IP 的請求在負載均衡時都打到同一臺機器上。以 Nginx 為例,可以配置 ip_hash 來實現。
但通常還是采用第一種方式,因為第二種相當于閹割了負載均衡,且仍沒有解決「用戶請求的機器宕機」的問題。
「node.js 下的 session 處理」
前面的圖很清楚了,服務端要實現對 cookie 和 session 的存取,實現起來要做的事還是很多的。在npm中,已經有封裝好的中間件,比如 express-session - npm,用法就不貼了。
這是它種的 cookie:
express-session - npm 主要實現了:
- 封裝了對cookie的讀寫操作,并提供配置項配置字段、加密方式、過期時間等。
- 封裝了對session的存取操作,并提供配置項配置session存儲方式(內存/redis)、存儲規則等。
- 給req提供了session屬性,控制屬性的set/get并響應到cookie和session存取上,并給req.session提供了一些方法。
應用方案:token
session 的維護給服務端造成很大困擾,我們必須找地方存放它,又要考慮分布式的問題,甚至要單獨為了它啟用一套 Redis 集群。有沒有更好的辦法?
我又想到學校,在沒有校園卡技術以前,我們都靠「學生證」。門衛小哥直接對照我和學生證上的臉,確認學生證有效期、年級等信息,就可以放行了。
回過頭來想想,一個登錄場景,也不必往 session 存太多東西,那為什么不直接打包到 cookie 中呢?這樣服務端不用存了,每次只要核驗 cookie 帶的「證件」有效性就可以了,也可以攜帶一些輕量的信息。
這種方式通常被叫做 token。
token 的流程是這樣的:
- 用戶登錄,服務端校驗賬號密碼,獲得用戶信息
- 把用戶信息、token 配置編碼成 token,通過 cookie set 到瀏覽器
- 此后用戶請求業務接口,通過 cookie 攜帶 token
- 接口校驗 token 有效性,進行正常業務接口處理
「客戶端 token 的存儲方式」
在前面 cookie 說過,cookie 并不是客戶端存儲憑證的唯一方式。token 因為它的「無狀態性」,有效期、使用限制都包在 token 內容里,對 cookie 的管理能力依賴較小,客戶端存起來就顯得更自由。但 web 應用的主流方式仍是放在 cookie 里,畢竟少操心。
「token 的過期」
那我們如何控制 token 的有效期呢?很簡單,把「過期時間」和數據一起塞進去,驗證時判斷就好。
token 的編碼
編碼的方式豐儉由人。
「base64」
比如 node 端的 cookie-session - npm 庫
不要糾結名字,其實是個 token 庫,但保持了和 express-session - npm 高度一致的用法,把要存的數據掛在 session 上
默認配置下,當我給他一個 userid,他會譯成這樣:
這里的 eyJ1c2VyaWQiOiJhIn0=,就是 {"userid":"abb”} 的 base64 而已。
「防篡改」
那問題來了,如果用戶 cdd 拿{"userid":"abb”}轉了個 base64,再手動修改了自己的 token 為 eyJ1c2VyaWQiOiJhIn0=,是不是就能直接訪問到 abb 的數據了?
是的。所以看情況,如果 token 涉及到敏感權限,就要想辦法避免 token 被篡改。
解決方案就是給 token 加簽名,來識別 token 是否被篡改過。例如在 cookie-session - npm 庫中,增加兩項配置:
secret: 'iAmSecret',
signed: true,
這樣會多種一個 .sig cookie,里面的值就是 {"userid":"abb”} 和 iAmSecret通過加密算法計算出來的,常見的比如HmacSHA256 類 (System.Security.Cryptography) | Microsoft Docs。
好了,現在 cdd 雖然能偽造出eyJ1c2VyaWQiOiJhIn0=,但偽造不出 sig 的內容,因為他不知道 secret。
「JWT」
但上面的做法額外增加了 cookie 數量,數據本身也沒有規范的格式,所以 JSON Web Token Introduction - jwt.io 橫空出世了。
JSON Web Token (JWT) 是一個開放標準,定義了一種傳遞 JSON 信息的方式。這些信息通過數字簽名確保可信。
它是一種成熟的 token 字符串生成方案,包含了我們前面提到的數據、簽名。不如直接看一下一個 JWT token 長什么樣:
eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyaWQiOiJhIiwiaWF0IjoxNTUxOTUxOTk4fQ.2jf3kl_uKWRkwjOP6uQRJFqMlwSABcgqqcJofFH5XCo
這串東西是怎么生成的呢?看圖:
類型、加密算法的選項,以及 JWT 標準數據字段,可以參考 RFC 7519 - JSON Web Token (JWT)
node 上同樣有相關的庫實現:express-jwt - npm koa-jwt - npm
refresh token
token,作為權限守護者,最重要的就是「安全」。
業務接口用來鑒權的 token,我們稱之為 access token。越是權限敏感的業務,我們越希望 access token 有效期足夠短,以避免被盜用。但過短的有效期會造成 access token 經常過期,過期后怎么辦呢?
一種辦法是,讓用戶重新登錄獲取新 token,顯然不夠友好,要知道有的 access token 過期時間可能只有幾分鐘。
另外一種辦法是,再來一個 token,一個專門生成 access token 的 token,我們稱為 refresh token。
- access token 用來訪問業務接口,由于有效期足夠短,盜用風險小,也可以使請求方式更寬松靈活
- refresh token 用來獲取 access token,有效期可以長一些,通過獨立服務和嚴格的請求方式增加安全性;由于不常驗證,也可以如前面的 session 一樣處理
有了 refresh token 后,幾種情況的請求流程變成這樣:
如果 refresh token 也過期了,就只能重新登錄了。
session 和 token
session 和 token 都是邊界很模糊的概念,就像前面說的,refresh token 也可能以 session 的形式組織維護。
狹義上,我們通常認為 session 是「種在 cookie 上、數據存在服務端」的認證方案,token 是「客戶端存哪都行、數據存在 token 里」的認證方案。對 session 和 token 的對比本質上是「客戶端存 cookie / 存別地兒」、「服務端存數據 / 不存數據」的對比。
「客戶端存 cookie / 存別地兒」
存 cookie 固然方便不操心,但問題也很明顯:
- 在瀏覽器端,可以用 cookie(實際上 token 就常用 cookie),但除了瀏覽器端,沒有 cookie 怎么辦?
- cookie 是瀏覽器在域下自動攜帶的,這就容易引發 CSRF 攻擊(前端安全系列(二):如何防止CSRF攻擊?- 美團技術團隊)
存別的地方,可以解決沒有 cookie 的場景;通過參數等方式手動帶,可以避免 CSRF 攻擊。
「服務端存數據 / 不存數據」
- 存數據:請求只需攜帶 id,可以大幅縮短認證字符串長度,減小請求體積
- 不存數據:不需要服務端整套的解決方案和分布式處理,降低硬件成本;避免查庫帶來的驗證延遲
單點登錄
前面我們已經知道了,在同域下的客戶端/服務端認證系統中,通過客戶端攜帶憑證,維持一段時間內的登錄狀態。
但當我們業務線越來越多,就會有更多業務系統分散到不同域名下,就需要「一次登錄,全線通用」的能力,叫做「單點登錄」。
“虛假”的單點登錄(主域名相同)
簡單的,如果業務系統都在同一主域名下,比如wenku.baidu.com tieba.baidu.com,就好辦了。可以直接把 cookie domain 設置為主域名 baidu.com,百度也就是這么干的。
“真實”的單點登錄(主域名不同)
比如滴滴這么潮的公司,同時擁有didichuxing.com xiaojukeji.com didiglobal.com等域名,種 cookie 是完全繞不開的。
這要能實現「一次登錄,全線通用」,才是真正的單點登錄。
這種場景下,我們需要獨立的認證服務,通常被稱為 SSO。
「一次「從 A 系統引發登錄,到 B 系統不用登錄」的完整流程」
- 用戶進入 A 系統,沒有登錄憑證(ticket),A 系統給他跳到 SSO
- SSO 沒登錄過,也就沒有 sso 系統下沒有憑證(注意這個和前面 A ticket 是兩回事),輸入賬號密碼登錄
- SSO 賬號密碼驗證成功,通過接口返回做兩件事:一是種下 sso 系統下憑證(記錄用戶在 SSO 登錄狀態);二是下發一個 ticket
- 客戶端拿到 ticket,保存起來,帶著請求系統 A 接口
- 系統 A 校驗 ticket,成功后正常處理業務請求
- 此時用戶第一次進入系統 B,沒有登錄憑證(ticket),B 系統給他跳到 SSO
- SSO 登錄過,系統下有憑證,不用再次登錄,只需要下發 ticket
- 客戶端拿到 ticket,保存起來,帶著請求系統 B 接口
「完整版本:考慮瀏覽器的場景」
上面的過程看起來沒問題,實際上很多 App 等端上這樣就夠了。但在瀏覽器下不見得好用。
看這里:
對瀏覽器來說,SSO 域下返回的數據要怎么存,才能在訪問 A 的時候帶上?瀏覽器對跨域有嚴格限制,cookie、localStorage 等方式都是有權限制的。
這就需要也只能由 A 提供 A 域下存儲憑證的能力。一般我們是這么做的:
圖中我們通過顏色把瀏覽器當前所處的域名標記出來。注意圖中灰底文字說明部分的變化。
- 在 SSO 域下,SSO 不是通過接口把 ticket 直接返回,而是通過一個帶 code 的 URL 重定向到系統 A 的接口上,這個接口通常在 A 向 SSO 注冊時約定
- 瀏覽器被重定向到 A 域下,帶著 code 訪問了 A 的 callback 接口,callback 接口通過 code 換取 ticket
- 這個 code 不同于 ticket,code 是一次性的,暴露在 URL 中,只為了傳一下換 ticket,換完就失效
- callback 接口拿到 ticket 后,在自己的域下 set cookie 成功
- 在后續請求中,只需要把 cookie 中的 ticket 解析出來,去 SSO 驗證就好
- 訪問 B 系統也是一樣
總結
- HTTP 是無狀態的,為了維持前后請求,需要前端存儲標記
- cookie 是一種完善的標記方式,通過 HTTP 頭或 js 操作,有對應的安全策略,是大多數狀態管理方案的基石
- session 是一種狀態管理方案,前端通過 cookie 存儲 id,后端存儲數據,但后端要處理分布式問題
- token 是另一種狀態管理方案,相比于 session 不需要后端存儲,數據全部存在前端,解放后端,釋放靈活性
- token 編碼技術,通常基于 base64,或增加加密算法防篡改,jwt 是一種成熟的編碼方案
- 在復雜系統中,token 可通過 service token、refresh token 得分權,同時滿足安全性和用戶體驗
- session 和 token 的對比就是「用不用cookie」和「后端存不存」的對比
- 單點登錄要求不同域下的系統「一次登錄,全線通用」,通常由獨立的 SSO 系統記錄登錄狀態、下發 ticket,各業務系統配合存儲和認證 ticket