在第十屆中國電子信息博覽會(CITE 2022)中,深信服信創應用交付AD收獲“第十屆中國電子信息博覽會創新獎”。
由相關行業協會、顧問咨詢機構、權威媒體等20余位專家參加評審,深信服信創AD憑借著卓越的性能及穩定性,在眾多企業申報的項目中脫穎而出。
負載均衡承載著用戶的核心業務,穩定,是一切業務運行的前提。作為一個全國產化的負載均衡產品,深信服信創AD在穩定性上是否足夠出色?有哪些關鍵技術已走在前面?
今天我們就聚焦一件事——軟件穩定性。
一、故障恢復「加速器」——全自研應用層網絡協議棧+DPDK技術保證業務穩定運行
能在負載設備發生意外故障時,做到快速恢復且不影響業務運行,是深信服信創AD的實力之一。
數據傳輸主要涉及三個系統結構層次:物理層、內核層、應用層。默認情況下,數據是從物理網卡逐層傳遞到業務應用的。一般的負載均衡產品會在內核層以模塊的形式開發業務,或者直接在內核層修改代碼以實現自身業務邏輯,數據會經過多次交換,導致傳輸效率低下、設備性能下降,當內核層出現問題時,會直接影響設備的正常運行。
為了真正提升設備故障后及時恢復的速度、提升整體設備性能,深信服信創AD打造全自研應用層協議棧,并且改進了DPDK技術。
管理面和數據面分離,管理面通過Eth0管理網口,再通過內核協議棧,最后到應用層。而直接影響負載性能的數據面則通過DPDK技術直接接管物理網卡,繞過內核邏輯直達應用層。
深信服信創AD多維度考量業務穩定,既注重當下架構穩定,又著眼未來升級:
1、應用層架構避免觸發內核層BUG降低宕機風險
一般的負載均衡產品,基于內核模塊開發的數據面,在故障時容易觸發系統宕機,而內核層宕機重啟時間基本不會低于3分鐘。
深信服信創AD因數據面不過內核層,避免了宕機風險。就算應用層出現意外故障,也可以在1秒內完成重啟,即便是沒有雙機保證的情況下,仍然可以做到故障快速恢復。
2、內核補丁升級時數據面保持正常運行
基于內核模塊開發的數據面,內核升級是一件十分“傷筋動骨”的事,可能5-6年才會考慮升級一次。因此,內核的整體穩定性也很難得到保證。
深信服信創AD自研的應用層協議+DPDK架構,可以做到快速打內核補丁,修復漏洞,或切換內核大版本兼容新硬件,而這個過程不會影響數據面的運行。同時,深信服應用交付網關V7.0軟件通過與國產CPU、國產操作系統的穩定版本更新升級,不斷提升整體穩定性。
二、故障「追蹤器」——豐富的自研應用層調試接口及工具
快速定位設備故障
當設備出現故障導致業務出現部分異常時,要在不影響業務連續性的前提下進行調試,并且盡快定位故障予以解決,需要配套成熟的調試工具對接設備的接口,以獲取設備的信息。
深信服信創AD采用了DPDK技術,實現跨過內核層直達應用層架構。通過在應用層自研抓包機制、自研Proc接口、自研調試工具等技術,可以看到更豐富的系統數據流信息;通過應用層直接讀取系統數據面狀態,使應用層面的調試效率更高效,有利于快速定位設備故障,實現快速恢復。
1、自研更豐富的抓包機制
深信服自研調試工具,不僅支持原生調試工具TCPDump的所有命令參數和功能,獲取當前收發包信息,還對抓包功能進行了擴展,可以額外抓取錯誤包、某特定服務的包、關聯連接相關的包信息,以此獲取更全面的設備信息,幫助工作人員迅速了解設備狀況。
2、定制應用層proc接口
proc文件系統是內核層的一種偽文件系統,通過這些文件可以查看系統硬件及當前正在運行進程的相關信息,甚至可以通過更改其中某些文件來改變內核的運行狀態。
深信服信創AD通過模擬內核層在應用層定制proc接口,直接從應用層數據面讀取當前狀態,包括當前連接跟蹤信息、會話保持信息、鄰居項等實時信息,獲取各服務當前新建速率、并發速率、延遲信息、錯誤計數等業務運行時的狀態信息,降低運維難度,保證工作人員能及時發現并處理故障問題。
3、設備故障后易定位
負載全應用層架構可直接在調試工具GDB內運行,通過調試工具,可以輕易獲取程序運行時的內存信息,運維人員可及時知悉運行狀態,迅速排查問題,高效處理。
三、硬核「裝備包」——自研混沌測試平臺D-TaaS
將故障解決在搖籃里
盡可能跑在故障前面,避免故障出現,是一個好負載均衡產品的“自我修養”。信創AD自研混沌測試平臺D-TaaS,通過多種端到端的測試手段,提前識別薄弱點并進行改善,最大程度保證負載設備的穩定性,將故障率降到最低。
1、精準豐富的故障注入
混沌測試平臺D-TaaS具備100多種故障場景,涵蓋硬件、系統、網絡、軟件、運維等故障注入的可靠性測試范圍,模擬在異常復雜的環境中是否能保證業務高可用。通過故障注入測試,可平均發現歷史遺留問題占比30%左右,在設備正式交付前就做好排查和預防。
2、豐富的壓力流量測試插件
混沌測試平臺D-TaaS全面支持網絡層多種背景壓力插件,共具備70多個背壓模型,支持性能背壓混合負載,如四層/七層流量,TCP/UDP流量、大小包流量、多樣協議類型等,產品具備高兼容性,保證信創AD在復雜環境下的良好穩定性及高性能。
3、真實客戶場景下組件服務化
模擬70多個業務場景,并支持隨機編排組合,在測試環境下就能模擬用戶場景的多樣化,使信創AD的產品業務應用測試更加符合真實的客戶場景。通過將測試執行、測試環境、測試報告、測試用例等組件服務化,在真實用戶環境下,可以實現無人值守7*24小時的自動化運行。
采用全國產化技術,深信服信創AD保持著成熟的穩定性,在高并發、大吞吐等復雜場景下也能穩穩承載用戶的業務運行,已在超57家金融行業用戶中落地實踐,也已為超120家政府、醫療等行業用戶提供高性能、高穩定性的業務承載能力。