redis 是內存數據庫,數據都是存儲在內存中,為了避免進程退出導致數據的永久丟失,需要定期將 Redis 中的數據以數據或命令的形式從內存保存到本地磁盤。當下次 Redis 重啟時,利用持久化文件進行數據恢復。Redis 提供了 RDB 和 AOF 兩種持久化機制,前者將當前的數據保存到磁盤,后者則是將每次執行的寫命令保存到磁盤(類似于 MySQL 的 Binlog)。本文將詳細介紹 RDB 和 AOF 兩種持久化方案,包括操作方法和持久化的實現原理。
正文
Redis 是一個基于 K-V 存儲的數據庫服務器,下面先介紹 Redis 數據庫的內部構造以及 K-V 的存儲形式,有助于我們更容易理解 Redis 的持久化機制。
1. Redis數據庫結構
一個單機的 Redis 服務器默認情況下有 16 個數據庫(0-15號),默認使用的是 0 號數據庫,可以使用 SELECT 命令切換數據庫。
Redis 中的每個數據庫都由一個 redis.h/redisDb 結構表示,它記錄了單個 Redis 數據庫的鍵空間、所有鍵的過期時間、處于阻塞狀態和就緒狀態的鍵、數據庫編號等等。
typedef struct redisDb { // 數據庫鍵空間,保存著數據庫中的所有鍵值對 dict *dict; // 鍵的過期時間,字典的鍵為鍵,字典的值為過期事件 UNIX 時間戳 dict *expires; // 正處于阻塞狀態的鍵 dict *blocking_keys; // 可以解除阻塞的鍵 dict *ready_keys; // 正在被 WATCH 命令監視的鍵 dict *watched_keys; struct evictionPoolEntry *eviction_pool; // 數據庫編號 int id; // 數據庫的鍵的平均 TTL,統計信息 long long avg_ttl; } redisDb; 復制代碼
由于 Redis 是一個鍵值對數據庫(key-value pairs database), 所以它的數據庫本身也是一個字典,對應的結構正是 redisDb。其中,dict 指向的是一個記錄鍵值對數據的字典,它的鍵是一個字符串對象,它的值則可以是字符串、列表、哈希表、集合和有序集合在內的任意一種 Redis 類型對象。 expires 指向的是一個用于記錄鍵的過期時間的字典,它的鍵為 dict 中的數據庫鍵,它的值為這個數據庫鍵的過期時間戳,這個值以 long long 類型表示。
2. RDB持久化
RDB 持久化(也稱作快照持久化)是指將內存中的數據生成快照保存到磁盤里面,保存的文件后綴是 .rdb。rdb 文件是一個經過壓縮的二進制文件,當 Redis 重新啟動時,可以讀取 rdb 快照文件恢復數據。RDB 功能最核心的是 rdbSave 和 rdbLoad 兩個函數, 前者用于生成 RDB 文件并保存到磁盤,而后者則用于將 RDB 文件中的數據重新載入到內存中:
RDB 文件是一個單文件的全量數據,很適合數據的容災備份與恢復,通過 RDB 文件恢復數據庫耗時較短,通常 1G 的快照文件載入內存只需 20s 左右。Redis 提供了手動觸發保存、自動保存間隔兩種 RDB 文件的生成方式,下面先介紹 RDB 的創建和載入過程。
2.1. RDB的創建和載入
2.1.1. 手動觸發保存
Redis 提供了兩個用于生成 RDB 文件的命令,一個是 SAVE,另一個是 BGSAVE。而觸發 Redis 進行 RDB 備份的方式有兩種,一種是通過 SAVE 命令、BGSAVE 命令手動觸發快照生成的方式,另一種是配置保存時間和寫入次數,由 Redis 根據條件自動觸發保存操作。
1. SAVE命令
SAVE 是一個同步式的命令,它會阻塞 Redis 服務器進程,直到 RDB 文件創建完成為止。在服務器進程阻塞期間,服務器不能處理任何其他命令請求。
- 客戶端命令
127.0.0.1:6379> SAVE OK 復制代碼
- 服務端日志
6266:M 15 Sep 2019 08:31:01.258 * DB saved on disk 復制代碼
執行 SAVE 命令后,Redis 在服務端進程(PID為6266)執行了 SAVE 操作,這個操作發生期間會一直阻塞 Redis 客戶端的請求處理。
2. BGSAVE命令
BGSAVE 是一個異步式的命令,和 SAVE 命令直接阻塞服務器進程的做法不同,BGSAVE 命令會派生出一個子進程,由子進程負責創建 RDB 文件,服務器進程(父進程)繼續處理客戶的命令。
- 客戶端命令
127.0.0.1:6379> BGSAVE Background saving started 復制代碼
- 服務端日志
6266:M 15 Sep 2019 08:31:22.914 * Background saving started by pid 6283 6283:C 15 Sep 2019 08:31:22.915 * DB saved on disk 6266:M 15 Sep 2019 08:31:22.934 * Background saving terminated with success 復制代碼
通過服務端輸出的日志,可以發現Redis 在服務端進程(PID為6266)會為 BGSAVE 命令單獨創建(fork)一個子進程(PID為6283),并由子進程在后臺完成 RDB 的保存過程,在操作完成之后通知父進程然后退出。在整個過程中,服務器進程只會消耗少量時間在創建子進程和處理子進程信號量上面,其余時間都是待命狀態。
BGSAVE 是觸發 RDB 持久化的主流方式,下面給出 BGSAVE 命令生成快照的流程:
- 客戶端發起 BGSAVE 命令,Redis 主進程判斷當前是否存在正在執行備份的子進程,如果存在則直接返回
- 父進程 fork 一個子進程 (fork 的過程中會造成阻塞的情況),這個過程可以使用 info stats 命令查看 latest_fork_usec 選項,查看最近一次 fork 操作消耗的時間,單位是微秒
- 父進程 fork 完成之后,則會返回 Background saving started 的信息提示,此時 fork 阻塞解除
- fork 創建的子進程開始根據父進程的內存數據生成臨時的快照文件,然后替換原文件
- 子進程備份完畢后向父進程發送完成信息,父進程更新統計信息
3. SAVE和BGSAVE的比較
命令SAVEBGSAVEIO類型同步異步是否阻塞全程阻塞fork時發生阻塞復雜度O(n)O(n)優點不會消耗額外的內存不阻塞客戶端缺點阻塞客戶端fork子進程消耗內存
2.1.2. 自動觸發保存
因為 BGSAVE 命令可以在不阻塞服務器進程的情況下執行,所以 Redis 的配置文件 redis.conf 提供了一個 save 選項,讓服務器每隔一段時間自動執行一次 BGSAVE 命令。用戶可以通過 save 選項設置多個保存條件,只要其中任意一個條件被滿足,服務器就會執行 BGSAVE 命令。 Redis 配置文件 redis.conf 默認配置了以下 3 個保存條件:
save 900 1 save 300 10 save 60 10000 復制代碼
那么只要滿足以下 3 個條件中的任意一個,BGSAVE 命令就會被自動執行:
- 服務器在 900 秒之內,對數據庫進行了至少 1 次修改。
- 服務器在 300 秒之內,對數據庫進行了至少 10 次修改。
- 服務器在 60 秒之內,對數據庫進行了至少 10000 次修改。
Redis 服務器會周期性地操作 serverCron 函數,這個函數每隔 100 毫秒就會執行一次,它的一項任務就是檢查 save 選項所設置的保存條件是否滿足,如果滿足的話,就自動執行 BGSAVE 命令。
2.1.3. 啟動自動載入
和使用 SAVE 和 BGSAVE 命令創建 RDB 文件不同,Redis 沒有專門提供用于載入 RDB 文件的命令,RDB 文件的載入過程是在 Redis 服務器啟動時自動完成的。啟動時只要在指定目錄檢測到 RDB 文件的存在,Redis 就會通過 rdbLoad 函數自動載入 RDB 文件。
下面是 Redis 服務器啟動時打印的日志,倒數第 2 條日志是在成功載入 RDB 文件后打印的。
$ redis-server /usr/local/etc/redis.conf 6266:C 15 Sep 2019 08:30:41.830 # Redis version=5.0.5, bits=64, commit=00000000, modified=0, pid=6266, just started 6266:C 15 Sep 2019 08:30:41.830 # Configuration loaded 6266:M 15 Sep 2019 08:30:41.831 * Increased maximum number of open files to 10032 (it was originally set to 256). 6266:M 15 Sep 2019 08:30:41.832 # Server initialized 6266:M 15 Sep 2019 08:30:41.833 * DB loaded from disk: 0.001 seconds 6266:M 15 Sep 2019 08:30:41.833 * Ready to accept connections 復制代碼
由于 AOF 文件屬于增量的寫入命令備份,RDB 文件屬于全量的數據備份,所以更新頻率比 RDB 文件的更新頻率高。所以如果 Redis 服務器開啟了 AOF 持久化功能,那么服務器會優先使用 AOF 文件來還原數據庫狀態;只有在 AOF 的持久化功能處于關閉狀態時,服務器才會使用優先使用 RDB 文件還原數據庫狀態。
2.2. RDB的文件結構
RDB 文件是經過壓縮的二進制文件,下面介紹關于RDB文件的一些細節。
2.2.1. 存儲路徑
SAVE 命令和 BGSAVE 命令都只會備份當前數據庫,備份文件名默認為 dump.rdb,可通過配置文件修改備份文件名 dbfilename xxx.rdb。可以通過以下命令查看備份文件目錄和 RDB 文件名稱:
$ redis-cli -h 127.0.0.1 -p 6379 127.0.0.1:6379> CONFIG GET dir 1) "dir" 2) "/usr/local/var/db/redis" 127.0.0.1:6379> CONFIG GET dbfilename 1) "dbfilename" 2) "dump.rdb" 復制代碼
RDB 文件的存儲路徑既可以在啟動前配置,也可以通過命令動態設定。
- 配置項:通過 dir 配置指定目錄,dbfilename 指定文件名
- 動態指定:Redis 啟動后也可以動態修改 RDB 存儲路徑,在磁盤損害或空間不足時非常有用,執行命令為:
config set dir {newdir} config set dbfilename {newFileName} 復制代碼