當今時代,數據和信息猶如各行各業(yè)的業(yè)務基礎和命脈。信息化在帶來便捷的同時,也必須面對數據丟失的風險。
天有不測風云,自然世界,如火災、地震等災難事件時有發(fā)生。對IT人來說,當某處應用系統(tǒng)因為災難停機,往往需要7*24小時緊急待機處理,期間還得對數據安全提心吊膽。
面對風險和難題,企業(yè)應該做好萬全之策,例如更新容災系統(tǒng),守住最后一道保障關卡。本文就為你詳解容災系統(tǒng)中的重要“招式”——異步遠程復制。
作為容災系統(tǒng)的核心技術之一,存儲系統(tǒng)的數據復制是一種可保持兩地間數據一致性和實現(xiàn)災難恢復的關鍵技術,當生產中心故障時,用戶可利用災備中心的數據備份恢復生產數據,此外也可以通過災備中心直接提供運營支撐環(huán)境快速恢復業(yè)務,滿足企業(yè)對RPO和RTO的要求。
數據復制實現(xiàn)原理和問題分析
同步復制or異步復制
當前,存儲系統(tǒng)的復制技術通常分為同步復制和異步復制。同步復制可以做到主/備集群的數據同步更新,要求每一個寫入操作在執(zhí)行下一個操作處理之前,在源端和目標端都能完成;而異步復制因為采用周期性同步的方式,在處理下一個操作前,無需等待數據復制到目標系統(tǒng)中。
同步復制有著能最大限度地減少數據丟失量的優(yōu)勢,擁有更強的數據一致性,但也因此會影響生產系統(tǒng)的性能。而異步復制能在保證主從數據的最終一致性的同時,最大限度減少由于數據遠程傳輸的時延而造成的業(yè)務性能下降。在建設容災系統(tǒng)時,企業(yè)可以結合不同的業(yè)務場景,選擇不同的數據復制方式。因此,如果不是業(yè)務上對此有非常苛刻的要求,在對業(yè)務性能要求高,但是RPO要求不高的場景,通常采用異步復制的方式進行容災備份。
異步遠程復制,快照機制成主流
目前,業(yè)界實現(xiàn)異步復制技術主要分為基于日志機制和基于快照機制兩類。
1.基于日志機制
對于基于日志的數據復制,客戶端的數據更新請求,首先要寫入日志中,當日志寫入成功,然后再把數據寫入對應的存儲空間。日志中會給每一個數據更新操作分配一個唯一遞增的序列號,從而保障數據恢復時能夠按照正確的順序執(zhí)行,保障數據一致性和完整性。備份集群從主集群遠程讀取到日志操作后,基于日志序列號在本地進行數據回放,從而完成數據復制工作。
該機制由于需要先把數據寫入日志,然后再更新本地集群,因此至少有一次以上的寫入數據放大,進而導致業(yè)務寫性能存在一倍以上的性能下降,在異步數據復制場景比較少見。
2.基于快照機制
基于快照的數據復制,就是定時在主集群對數據進行一次“照相”,生成一個描述當前數據狀態(tài)的快照。備份集群通過比較主集群兩個快照差異,來確認快照間隔時間內所發(fā)生的數據變化,并通過同步快照時間的差異數據來完成數據復制工作。
圖1 基于快照機制實現(xiàn)異步遠程復制-初始全量同步
圖2 基于快照機制實現(xiàn)異步遠程復制-增量同步
基于快照的數據復制由于數據同步效率高,因此使用場景廣泛。但是,由于需要通過頻繁的更新快照來記錄數據狀態(tài),并且通過比較兩個快照之間的數據差異來實現(xiàn)增量數據同步,因此快照的的實現(xiàn)機制以及獲取快照之間差異數據的效率決定了基于快照的數據復制機制的效率。
為了方便記錄不同存儲卷的數據狀態(tài),常用的方法是使用一個額外的索引位圖。當存在數據更新時,先更新對應位圖中的狀態(tài)信息,再寫入數據。但這種方式引入了兩個問題:
1. 索引位圖的更新需要通過互斥鎖來保證一致性,在常用的塊存儲多路徑場景,不同的存儲網關更新索引位圖時會存在鎖競爭,導致出現(xiàn)頻繁搶鎖,極大地影響存儲的寫入性能。
2. 由于索引位圖存儲較為集中并且需要頻繁更新,很容易成為寫熱點,進而影響存儲集群的讀寫性能。
針對上述問題,杉巖USP統(tǒng)一存儲平臺通過基于快照機制的異步遠程復制方案和深度優(yōu)化,實現(xiàn)后臺異步遠程復制高效增量同步和用戶前臺業(yè)務高性能平穩(wěn)運行兩不誤。
杉巖USP異步遠程復制,打造高性能方案
杉巖數據采用基于自有專利的ALUA卷級負載均衡、自適應索引IO聚合和高性能RoW快照技術,提供一個高性能、高可靠的數據復制方案。
ALUA機制
杉巖USP在業(yè)內率先支持ALUA機制(點擊查看:杉巖USP統(tǒng)一存儲平臺業(yè)內率先支持ALUA機制),避免了多路徑場景的鎖競爭問題,提升了不同卷的索引位圖訪問聚合度,大大減少下盤訪問的平均開銷,提升前臺業(yè)務IO的整體性能;并且利用ALUA的動態(tài)負載均衡功能,可有效降低后臺異步遠程復制任務對前臺業(yè)務IO的影響,而ALUA的秒級故障快速切換功能則可有效保障前臺業(yè)務IO的平穩(wěn)連續(xù)運行。
細粒度數據塊狀態(tài)位圖和IO聚合
杉巖USP異步復制特性,可將卷或快照的索引位圖拆分為更精細粒度的子塊,并結合層次的內存元數據索引,既可加速獲取快照之間的差異數據,又可減少對索引數據的頻繁訪問;并且索引位圖數據打散存放,可避免頻繁訪問索引位圖數據所帶來的訪問熱點問題。同時,針對索引位圖的更新還進行了自適應的IO聚合處理,進一步降低了更新索引位圖對業(yè)務IO性能的影響。
RoW機制
杉巖USP異步遠程復制的快照采用RoW(寫時重定向)機制,可有效避免快照對業(yè)務寫IO的影響,同時基于獨有專利技術解決傳統(tǒng)RoW快照造成空間離散影響讀性能的問題,可最大程度降低異步復制快照對業(yè)務IO的性能影響。
價值總結
杉巖USP統(tǒng)一存儲平臺的異步遠程復制功能既充分保證了高效的后臺增量同步,實現(xiàn)系統(tǒng)容災備份,又有效保障了前臺業(yè)務的高效平穩(wěn)和連續(xù)運行,使用戶擁有了高可靠、高穩(wěn)定、高可用和高性能的極致體驗。主要價值如下:
遠端備份和恢復:業(yè)務數據失效后,可通過遠端的備份數據進行恢復,避免主端存儲集群數據失效后,由于數據丟失造成的損失。
持續(xù)的業(yè)務支撐:災難發(fā)生時可以通過從端存儲集群快速接管主端存儲集群的業(yè)務數據,以保證業(yè)務的可靠性,避免主端存儲集群故障后,由于業(yè)務中斷造成的損失。
容災恢復:災難發(fā)生后可以通過從端存儲集群的數據實現(xiàn)主端存儲集群數據的恢復,避免災難發(fā)生后,由于業(yè)務數據丟失或恢復時間過長造成的損失。