- 在高并發(fā)的場(chǎng)景下,大量的請(qǐng)求直接訪問MySQL很容易造成性能問題
- 所以,我們都會(huì)用redis來做數(shù)據(jù)的緩存,削減對(duì)數(shù)據(jù)庫的請(qǐng)求
- 但是,Mysql和Redis是兩種不同的數(shù)據(jù)庫,如何保證不同數(shù)據(jù)庫之間數(shù)據(jù)的一致性就非常關(guān)鍵了
# 導(dǎo)致數(shù)據(jù)不一致的原因
- 在高并發(fā)的業(yè)務(wù)場(chǎng)景下,數(shù)據(jù)庫大多數(shù)情況都是用戶并發(fā)訪問最薄弱的環(huán)節(jié)。
- 所以,就需要使用redis做一個(gè)緩沖操作,讓請(qǐng)求先訪問到redis,而不是直接訪問MySQL等數(shù)據(jù)庫。
- 讀取緩存步驟一般沒有什么問題,但是一旦涉及到數(shù)據(jù)更新:數(shù)據(jù)庫和緩存更新,就容易出現(xiàn)緩存(Redis)和數(shù)據(jù)庫(MySQL)間的數(shù)據(jù)一致性問題。
- 這個(gè)業(yè)務(wù)場(chǎng)景,主要是解決讀數(shù)據(jù)從Redis緩存,一般都是按照下圖的流程來進(jìn)行業(yè)務(wù)操作。
# 緩存先后刪除問題
不管是先寫MySQL數(shù)據(jù)庫,再刪除Redis緩存;還是先刪除緩存,再寫庫,都有可能出現(xiàn)數(shù)據(jù)不一致的情況。
1.先刪除緩存
- 如果先刪除Redis緩存數(shù)據(jù),然而還沒有來得及寫入MySQL,另一個(gè)線程就來讀取
- 這個(gè)時(shí)候發(fā)現(xiàn)緩存為空,則去Mysql數(shù)據(jù)庫中讀取舊數(shù)據(jù)寫入緩存,此時(shí)緩存中為臟數(shù)據(jù)。
- 然后數(shù)據(jù)庫更新后發(fā)現(xiàn)Redis和Mysql出現(xiàn)了數(shù)據(jù)不一致的問題
2. 后刪除緩存
- 如果先寫了庫,然后再刪除緩存,不幸的寫庫的線程掛了,【關(guān)注尚硅谷,輕松學(xué)IT】導(dǎo)致了緩存沒有刪除
- 這個(gè)時(shí)候就會(huì)直接讀取舊緩存,最終也導(dǎo)致了數(shù)據(jù)不一致情況
- 因?yàn)閷懞妥x是并發(fā)的,沒法保證順序,就會(huì)出現(xiàn)緩存和數(shù)據(jù)庫的數(shù)據(jù)不一致的問題
# 解決方案
1. 延時(shí)雙刪策略
1.1 基本思路
- 在寫庫前后都進(jìn)行redis.del(key)操作,并且設(shè)定合理的超時(shí)時(shí)間。
- 偽代碼如下:
public void write( String key, Object data )
{
redis.delKey( key );
db.updateData( data );
Thread.sleep( 500 );
redis.delKey( key );
}
1.2 具體步驟
- 1.先刪除緩存
- 2.再寫數(shù)據(jù)庫
- 3.休眠500毫秒
- 4.再次刪除緩存
問題:這個(gè)500毫秒怎么確定的,具體該休眠多久時(shí)間呢?
- 需要評(píng)估自己的項(xiàng)目的讀數(shù)據(jù)業(yè)務(wù)邏輯的耗時(shí)。
- 這么做的目的,就是確保讀請(qǐng)求結(jié)束,寫請(qǐng)求可以刪除讀請(qǐng)求造成的緩存臟數(shù)據(jù)。
- 當(dāng)然這種策略還要考慮redis和數(shù)據(jù)庫主從同步的耗時(shí)。
- 最后的的寫數(shù)據(jù)的休眠時(shí)間:則在讀數(shù)據(jù)業(yè)務(wù)邏輯的耗時(shí)基礎(chǔ)上,加幾百ms即可。比如:休眠1秒。
1.3 設(shè)置緩存過期時(shí)間是關(guān)鍵點(diǎn)
- 從理論上來說,給緩存設(shè)置過期時(shí)間,是保證最終一致性的解決方案
- 所有的寫操作以數(shù)據(jù)庫為準(zhǔn),只要到達(dá)緩存過期時(shí)間,緩存刪除
- 如果后面還有讀請(qǐng)求的話,就會(huì)從數(shù)據(jù)庫中讀取新值然后回填緩存
1.4 方案缺點(diǎn)
結(jié)合雙刪策略+緩存超時(shí)設(shè)置,這樣最差的情況就是:
- 在緩存過期時(shí)間內(nèi)發(fā)生數(shù)據(jù)存在不一致
- 同時(shí)又增加了寫請(qǐng)求的耗時(shí)。
2.異步更新緩存(基于Mysql binlog的同步機(jī)制)
2.1 整體思路
1.涉及到更新的數(shù)據(jù)操作,利用Mysql binlog 進(jìn)行增量訂閱消費(fèi)
2.將消息發(fā)送到消息隊(duì)列
3.通過消息隊(duì)列消費(fèi)將增量數(shù)據(jù)更新到Redis上
4.操作情況
- 讀取Redis緩存:熱數(shù)據(jù)都在Redis上
- 寫Mysql:增刪改都是在Mysql進(jìn)行操作
- 更新Redis數(shù)據(jù):Mysql的數(shù)據(jù)操作都記錄到binlog,通過消息隊(duì)列及時(shí)更新到Redis上
2.2 Redis更新過程
(1) 數(shù)據(jù)操作主要分為兩種:
- 一種是全量(將所有數(shù)據(jù)一次性寫入Redis)
- 一種是增量(實(shí)時(shí)更新)
這里說的是增量,指的是mysql的update、insert、delate變更數(shù)據(jù)。
(2)讀取binlog后分析 ,利用消息隊(duì)列,推送更新各臺(tái)的redis緩存數(shù)據(jù)。
- 這樣一旦MySQL中產(chǎn)生了新的寫入、更新、刪除等操作,【關(guān)注尚硅谷,輕松學(xué)IT】就可以把binlog相關(guān)的消息推送至Redis
- Redis再根據(jù)binlog中的記錄,對(duì)Redis進(jìn)行更新
- 其實(shí)這種機(jī)制,很類似MySQL的主從備份機(jī)制,因?yàn)镸ySQL的主備也是通過binlog來實(shí)現(xiàn)的數(shù)據(jù)一致性
這里的消息推送工具你也可以采用別的第三方:kafka、rabbitMQ等來實(shí)現(xiàn)推送更新Redis!
# 總結(jié)
- 在高并發(fā)應(yīng)用場(chǎng)景下,如果是對(duì)數(shù)據(jù)一致性要求高的情況下,要定位好導(dǎo)致數(shù)據(jù)和緩存不一致的原因
- 解決高并發(fā)場(chǎng)景下數(shù)據(jù)一致性的方案有兩種,分別是延時(shí)雙刪策略和異步更新緩存兩種方案
- 另外,設(shè)置緩存的過期時(shí)間是保證數(shù)據(jù)保持一致性的關(guān)鍵操作,需要結(jié)合業(yè)務(wù)進(jìn)行合理的設(shè)置。
文章來源于JAVA面試那些事兒