日常工作中,MySQL數(shù)據(jù)庫(kù)是必不可少的存儲(chǔ),其中讀寫(xiě)分離基本是標(biāo)配,而這背后需要MySQL開(kāi)啟主從同步,形成一主一從、或一主多從的架構(gòu),掌握主從同步的原理和知道如何實(shí)際應(yīng)用,是一個(gè)架構(gòu)師的必備技能。樓主將在本文做總結(jié),看這一篇就夠了。
1、主從同步原理
主從同步架構(gòu)圖(異步同步)
這是最常見(jiàn)的主從同步架構(gòu)。
主從同步流程(異步同步)
- 主庫(kù)把數(shù)據(jù)變更寫(xiě)入binlog文件
- 從庫(kù)I/O線程發(fā)起dump請(qǐng)求
- 主庫(kù)I/O線程推送binlog至從庫(kù)
- 從庫(kù)I/O線程寫(xiě)入本地的relay log文件(與binlog格式一樣)
- 從庫(kù)SQL線程讀取relay log并重新串行執(zhí)行一遍,得到與主庫(kù)相同的數(shù)據(jù)
什么是binlog?
主庫(kù)每提交一次事務(wù),都會(huì)把數(shù)據(jù)變更,記錄到一個(gè)二進(jìn)制文件中,這個(gè)二進(jìn)制文件就叫binlog。需注意:只有寫(xiě)操作才會(huì)記錄至binlog,只讀操作是不會(huì)的(如select、show語(yǔ)句)。
binlog的3種格式:
- statement格式:binlog記錄的是實(shí)際執(zhí)行的sql語(yǔ)句
- row格式:binlog記錄的是變化前后的數(shù)據(jù)(涉及所有列),形如update table_a set col1=value1, col2=value2 ... where col1=condition1 and col2=condition2 ...
- mixed格式:默認(rèn)選擇statement格式,只在需要時(shí)改用row格式
binlog格式對(duì)比
- statement級(jí)別:優(yōu)點(diǎn)是binlog文件小,缺點(diǎn)是主庫(kù)的慢sql也會(huì)在從庫(kù)上再出現(xiàn)一次,一些依賴(lài)環(huán)境或上下文的函數(shù)可能會(huì)產(chǎn)生不一致的數(shù)據(jù)
- row級(jí)別:缺點(diǎn)是文件大(一條語(yǔ)句如果涉及多行,會(huì)放大n倍),優(yōu)點(diǎn)是無(wú)上述慢sql問(wèn)題,不依賴(lài)環(huán)境或上下文
- 為了獲取前后變化數(shù)據(jù),canal建議使用row級(jí)別
主從同步的2種方式
- 異步同步:默認(rèn)方式,可能會(huì)導(dǎo)致主從切換時(shí)數(shù)據(jù)丟失。因?yàn)橹鲙?kù)是否commit與主從同步流程無(wú)關(guān),也不感知。
- 半同步:高可用方案,較新mysql版本支持,需要至少1個(gè)從庫(kù)(默認(rèn)1,具體數(shù)量可指定)對(duì)寫(xiě)入relay log進(jìn)行ack,主庫(kù)才會(huì)commit并把結(jié)果返回client。
主從同步流程(半同步)
- 從庫(kù)在連接主庫(kù)時(shí),表明自己支持半同步復(fù)制
- 主庫(kù)也需支持半同步復(fù)制,主庫(kù)commit事務(wù)前會(huì)阻塞等待至少一個(gè)從庫(kù)寫(xiě)入relay log的ack,直至超時(shí)
- 如果阻塞等待超時(shí),則主庫(kù)臨時(shí)切換回異步同步模式,當(dāng)至少一個(gè)從庫(kù)的半同步追上進(jìn)度時(shí),主庫(kù)再切換至半同步模式
半同步適用場(chǎng)景
高可用備份:半同步復(fù)制,可確保從庫(kù)與主庫(kù)的一致性,當(dāng)主庫(kù)發(fā)生故障時(shí),切換到從庫(kù)不會(huì)丟失數(shù)據(jù)。為了保證穩(wěn)定性(不因半同步慢而拖累主庫(kù)),一般不承擔(dān)業(yè)務(wù)流量、盡可能快地ack,只用于同步備份。
2、主從同步應(yīng)用場(chǎng)景
普通場(chǎng)景:線上從庫(kù)異步同步,高可用備份半同步
對(duì)一致性要求較高的大數(shù)據(jù)取數(shù)需求
大數(shù)據(jù)取數(shù)可能導(dǎo)致從庫(kù)cpu使用率飆升、ack變慢,可設(shè)置半同步所需ack數(shù)量為1,正常情況下高可用備份能很快ack,于是主庫(kù)會(huì)commit并返回,而大數(shù)據(jù)取數(shù)復(fù)制慢一些也無(wú)所謂。這樣就不會(huì)因?yàn)榇髷?shù)據(jù)取數(shù)ack慢而影響主庫(kù)和業(yè)務(wù)了。
參考:mysql官方文檔
- MySQL :: MySQL 5.7 Reference Manual :: 16.3.9 Semisynchronous Replication
- MySQL :: MySQL Internals Manual :: 20.1 Binary Log Overview