上篇文章介紹了Mongo讀取數據的策略(??MongoDB讀數據策略??),主要是readconcern、readpreference兩參數,其中readconcern作用于服務端,決定了什么時候能讀取到數據;readpreference在客戶端配置,決定讀哪個節點的數據。本文將要介紹Mongo的寫入策略,在介紹寫入策略前,先簡單說明MongoDB的Journaling特性。
Journaling介紹
MongoDB也有防carsh能力,和MySQL類似,也是通過預先寫日志(WAL)到文件實現,這文件就是Journaling功能。
To provide durability in the event of a failure, MongoDB uses write ahead logging to on-disk journal files.
?日志文件?
開啟Journaling功能后,Mongo 會在數據庫目錄下創建 journal目錄,用來存放journal日志,以WiredTiger引擎為例,文件格式是WiredTigerLog.<sequence>,其中<sequence>是從0000000001開始的零填充數字。journal日志文件默認大小為100 MB,超過該限制后,將創建一個新的日記文件,并會自動刪除舊的日志文件,僅保留從上一個檢查點恢復所需的文件。所以journal日志文件一般情況下只會生成兩三個,除非每秒有大量的寫操作發生。
?日志記錄?
journal記錄有這幾個特點:
它包括由初始寫入引起的任何內部寫入操作。例如,對集合中文檔的更新可能會導致對索引的修改;WiredTiger創建單個日志記錄,其中包含更新操作及其關聯的索引修改。
每個記錄都有一個唯一的標識符。
WiredTiger的最小日志記錄大小為128字節。
另外,為了提高存儲效率,MongoDB犧牲了一些CPU性能,對WiredTiger引擎對日志數據使用壓縮存儲,默認壓縮方式是snAppy壓縮,也支持其他壓縮方式,比如:zstd、zlib等,可以通過下面方式設置。
storage.wiredTiger.engineConfig.journalCompressor
總之,Journaling 是MongoDB中非常重要的一項功能,類似于關系數據庫中的事務日志。Journaling能夠使MongoDB由于意外故障后快速恢復。在2.0版本后,默認開啟了該功能。和MySQL一樣,Mongo 實例啟動時會檢查journal日志文件,確認是否有需要恢復的數據。不過由于提交journal日志會產生寫入阻塞,所以它對寫入的操作有性能影響,但在生產環境中通常還是開啟Journaling的。
數據寫入策略
writeconcern 是Mongo針對寫操作的參數,表示寫請求對 mongod 實例的確認級別,決定數據的持久性。它可以用下面三個選項表示。
{ w: <value>, j: <boolean>, wtimeout: <number> }
?writeconcern 選項?
w指定寫操作需要應用到多少個數據節點才能返回成功,可以為0、1、2、3或者majority。
- w: 0 表示客戶端不需要收到任何有關寫操作,就直接返回成功。
- w: 1 表示寫主成功,就直接返回成功。
- w: majority 需要收到多數節點(含主節點)關于操作執行成功的確認,具體個數根據復制集配置自動得出。比如,一主兩從3節點的集群,則需要2個節點確認寫入成功即可。
- w: N(N > 1)表示N個數據節點確認才返回成功。w 值越大,對客戶端來說,數據的安全性保證越強,同時寫操作的延遲越大。w 設置的節點數越多,等待的延遲也就越大。如果 w 等于總節點數,那么一旦其中某個節點出現故障就會導致整個寫入失敗,這也是有風險的。另外,針對Hidden、delayed和priority為0的數據節點,官方也特別做了說明,如下:
NOTE
Hidden, delayed, and priority 0 members can acknowledge w: <number> write operations.
Delayed secondaries can return write acknowledgment no earlier than the configured slaveDelay.
注意:
a、副本集中Hidden、delayed和priority為0的成員,可以確認w: <number>的寫操作。
b、延遲節點的返回寫ack,不會早于配置的slavedelay值 。
如果集群有 3 三個數據節點,在w: majority模式下 ,只需要寫入兩個數據節點即可返回,流程如下:
j表示寫操作是否要被持久化,只能選填 true 或 false。
- j:false 表示寫操作到cache即算作成功。
- j:true 表示寫操作到文件中才算成功。
從3.2版本后,如果指定j:true,即使 w:0 ,只有在請求的成員數(包括主成員)寫入日志后才返回數據。因此,j:true設置保證了MongoDB的數據持久化。
Changed in version 3.2: With j: true, MongoDB returns only after the requested number of members, including the primary, have written to the journal.
另外,僅僅j:true 不保證集群 failover 時發生回滾的寫操作。
j: true does not by itself guarantee that the write will not be rolled back due to replica set primary failover.
wtimeout:返回確認的超時時間,單位為毫秒。
如果寫入操作超過該值,則返回錯誤,即使最終寫入是成功了,但數據庫不會撤銷超時寫入的數據。如果沒有指定 wtimeout 值,則寫入操作將無限期阻塞,wtimeout:0 等同于該選項未設置值。同時,這個參數和 WriteConncern 的w值有關,并且只適用于w大于0的情況。比如:w:0,表示可以超時無限大,則不返回錯誤;w:1,只和主節點確認的超時時間;w:majority,表示需要和多數節點確認超時時間。
?數據提交策略?
MongoDB也有和MySQL有類似的提交策略,是由 commitIntervalMs 參數控制,它是日志持久化的間隔時間(以毫秒為單位)。如果想要更好的數據安全,可以設為每毫秒對cache中的數據做硬盤層面的sync;如果需要更好的寫入性能,最大可以改為每500毫秒做一次sync。它的取值范圍是1 ~ 500毫秒,默認值是100毫秒,不支持in-memory 存儲引擎。
總結
MongoDB 寫入策略包括以下幾個方面:
- w:指定寫入數據后需要在多少個節點上同步寫入成功后,才返回確認信息。
- j:設置 j:true 會將數據寫入日志中,可以在節點宕機時恢復數據。但是 j:true 并不保證數據已經寫入磁盤文件中。
- wtimeout:指定寫入超時時間。當寫入操作達到超時時間時,即使最終成功寫入也會返回錯誤信息。
在實際使用中,可以根據具體的業務需求和系統環境來選擇適合的寫入策略,以達到最佳的性能和可靠性。例如,在數據一致性要求高的場景中,可以使用 majority 寫入確認來保證數據同步的可靠性。而在性能要求高、數據不敏感的場景中,可以使用 w 值較小的寫入關注點來提高寫入性能。
本文轉載自微信公眾號「云數據庫技術」