需求起因
在高并發的業務場景下,數據庫大多數情況都是用戶并發訪問最薄弱的環節。所以,就需要使用redis做一個緩沖操作,讓請求先訪問到redis,而不是直接訪問MySQL等數據庫。
這個業務場景,主要是解決讀數據從Redis緩存,一般都是按照下圖的流程來進行業務操作。
讀取緩存步驟一般沒有什么問題,但是一旦涉及到數據更新:數據庫和緩存更新,就容易出現緩存(Redis)和數據庫(MySQL)間的數據一致性問題。
不管是先寫MySQL數據庫,再刪除Redis緩存;還是先刪除緩存,再寫庫,都有可能出現數據不一致的情況。舉一個例子:
1、如果刪除了緩存Redis,還沒有來得及寫庫MySQL,另一個線程就來讀取,發現緩存為空,則去數據庫中讀取數據寫入緩存,此時緩存中為臟數據。
2、如果先寫了庫,在刪除緩存前,寫庫的線程宕機了,沒有刪除掉緩存,則也會出現數據不一致情況。
因為寫和讀是并發的,沒法保證順序,就會出現緩存和數據庫的數據不一致的問題。
如來解決?這里給出兩個解決方案,先易后難,結合業務和技術代價選擇使用。
緩存和數據庫一致性解決方案
第一種方案:采用延時雙刪策略
在寫庫前后都進行redis.del(key)操作,并且設定合理的超時時間。
偽代碼如下
public void write(String key,Object data){ redis.delKey(key); db.updateData(data); Thread.sleep(500); redis.delKey(key); }1、具體的步驟就是:
1)先刪除緩存
2)再寫數據庫
3)休眠500毫秒
4)再次刪除緩存
那么,這個500毫秒怎么確定的,具體該休眠多久呢?
需要評估自己的項目的讀數據業務邏輯的耗時。這么做的目的,就是確保讀請求結束,寫請求可以刪除讀請求造成的緩存臟數據。
當然這種策略還要考慮redis和數據庫主從同步的耗時。最后的的寫數據的休眠時間:則在讀數據業務邏輯的耗時基礎上,加幾百ms即可。比如:休眠1秒。
2、設置緩存過期時間
從理論上來說,給緩存設置過期時間,是保證最終一致性的解決方案。所有的寫操作以數據庫為準,只要到達緩存過期時間,則后面的讀請求自然會從數據庫中讀取新值然后回填緩存。
3、該方案的弊端
結合雙刪策略+緩存超時設置,這樣最差的情況就是在超時時間內數據存在不一致,而且又增加了寫請求的耗時。
第二種方案:異步更新緩存(基于訂閱binlog的同步機制)
1、技術整體思路:
MySQL binlog增量訂閱消費+消息隊列+增量數據更新到redis
1)讀Redis:熱數據基本都在Redis
2)寫MySQL:增刪改都是操作MySQL
3)更新Redis數據:MySQ的數據操作binlog,來更新到Redis
2、Redis更新
1)數據操作主要分為兩大塊:
- 一個是全量(將全部數據一次寫入到redis)
- 一個是增量(實時更新)
這里說的是增量,指的是mysql的update、insert、delate變更數據。
2)讀取binlog后分析 ,利用消息隊列,推送更新各臺的redis緩存數據。
這樣一旦MySQL中產生了新的寫入、更新、刪除等操作,就可以把binlog相關的消息推送至Redis,Redis再根據binlog中的記錄,對Redis進行更新。
其實這種機制,很類似MySQL的主從備份機制,因為MySQL的主備也是通過binlog來實現的數據一致性。
這里可以結合使用canal(阿里的一款開源框架),通過該框架可以對MySQL的binlog進行訂閱,而canal正是模仿了mysql的slave數據庫的備份請求,使得Redis的數據更新達到了相同的效果。
當然,這里的消息推送工具你也可以采用別的第三方:kafka、rabbitMQ等來實現推送更新Redis。
如果覺得我寫的還不錯,就轉發該文章吧,你們的支持是我的動力。