今年7月,隨著列車自動監控及運營調度指揮系統的成功上線,某市地鐵14號線核心系統無感升級改造工作順利完成,標志著全國首個“軌道交通基于雙網段架構部署的列車自動控制系統國產化整體解決方案”成功落地。
作為數據庫產品及配套服務提供商,人大金倉于2021年7月起開展方案中數據庫的整體建設工作。作為軌道交通的核心業務系統之一的列車自動監控及運營調度指揮系統的國產化落地尤其值得關注。
粒度有限的高可用(升級前)
01現行數據庫高可用架構 對故障轉移支撐粒度有限
由于原系統采用Oracle DG一主兩備集群,需要第三方仲裁Observer觀察程序(OCI客戶端組件),才能完成自動故障轉移,另外Observer觀察程序又部署在Oracle DG備庫服務器上,該服務器故障將引起連鎖反應,導致現有數據庫高可用架構支持有限功能的故障轉移。
02傳統雙網方案與IT環境緊耦合 存在性能損耗,用戶體驗差
雙網方案利用外部IT環境實現,形成了雙網卡綁定、域名到多個IP的映射、Windows服務等多種傳統雙網方案,雙網卡綁定需要交換設備的支持、域名到多個IP的映射需要DNS服務器、利用Windows服務要求數據庫集群必須部署在Windows端,在任意一個網絡異常的情況下,傳統雙網方案與IT環境緊耦合,網卡切換依賴操作系統協議轉換,存在性能損耗,導致業務切換體驗差,后期通用性差、運維困難。
03 緊急故障恢復 便捷易用度亟待提高
原系統Oracle DG集群主庫發生故障,DG備庫升為主庫,一旦原主庫從宕機、斷網等崩潰中恢復,在進行故障轉移之前需要在數據庫上啟用“閃回數據庫”,且該數據庫上必須有所需的閃回日志,才能手動將原主庫恢復為備庫,形成新的Oracle DG主備集群,緊急故障恢復便捷易用性難以滿足軌道交通行業需求。
極致高可用(升級后)
架構升級,萬無一失
由于原系統Oracle DG主備集群需要依賴第三方仲裁程序Observer,才能實現故障自動轉移,加之第三方仲裁程序Observer部署在DG備庫服務器所帶來的關聯影響,現有數據庫高可用架構對故障轉移支持粒度有限。
金倉KES數據庫主備集群架構升級,內置自選主協議的高可用組件,保證了2F+1的容錯能力,即2F+1個節點的系統最大允許F個節點同時出現故障。更進一步,該協議具備自仲裁,自選主能力,使得金倉KES數據庫集群,在高可用方面可進一步得到增強:
1.通過自仲裁、自選主組件,更及時發現故障、更迅速故障自動切換,極大縮短RTO時間。
2.可控的選主算法自降級策略,充分保障系統可用性。
新雙網方案,全場景覆蓋,極致故障切換體驗
為了保證雙網方案具有較好的業務切換體驗,實現IT環境解耦,新雙網方案通過數據庫主備集群支持雙網段環境下的高可用性,數據庫直接接管雙網卡,任意一個網絡異常的情況下,網卡切換不依賴操作系統,沒有協議轉換,性能損耗降到最低,完全滿足軌道交通5秒內完成雙網切換的高可用需求。
新雙網方案在應用訪問方面實現了網絡高可用:
1.客戶端應用透明訪問的NDP和JDBC驅動程序支持多網絡地址的連接、尋址、可識別主備狀態;
2.NDP和JDBC驅動支持在雙網環境下客戶端應用連接數據庫主備高可用集群,在數據庫主備切換和單個網絡故障時,支持秒級業務切換。
3.新雙網方案在數據庫主備集群數據復制方面和集群HA管理方面實現了網絡高可用:
4.數據庫集群主備數據同步協議支持多IP地址尋址;
5.數據庫主備集群組件(HA)支持多IP地址尋址;
6.在任意一個網絡異常的情況下,仍可以找尋可用的網絡進行通信,而不會觸發集群間的故障轉移,從而保證數據庫集群的正常運行;
7.當數據庫主機發生故障時,集群自動切換至備用節點。
人大金倉數據庫架構已全面實現插件化解耦,本次項目升級建設采用數據庫雙網插件,避免侵入數據庫內核,保證數據庫內核穩定性,簡化了應用開發、運維,為系統升級和功能迭代奠定了堅實基礎:
緊急故障,自動恢復
原系統Oracle DG集群主庫喪失能力,備庫升為主庫后,要成功恢復原主數據庫,需要在故障轉移之前在數據庫上啟用“閃回數據庫”,且該數據庫上必須有所需的閃回日志,才能手動將原主庫恢復為備庫,形成新的Oracle DG主備集群,緊急故障恢復便捷易用度亟待提高。
金倉KES數據庫主備集群架構升級,并支持特定場景的深度定制開發,從而具備了緊急故障自動恢復的能力,大幅提升了運維人員的便捷易用性體驗:
金倉KES數據庫主備集群主庫宕機,備庫升為主庫后,新主庫將自動對原故障主庫進行恢復(例如此時原主庫已恢復供電或解決了設備癱瘓問題)。在業務恢復期間,新主庫始終對外提供服務,恢復過程對用戶無感,RTO/RPO=0!。
行業試點,服務全國
人大金倉持續在軌道交通行業大力布局,與國內領先的提供全生命周期管家式服務的軌道交通整體解決方案供應商深度合作,為軌道交通列車自動控制系統(ATS)的實時運行數據和系統配置數據提供極致高可用的數據存儲與計算支撐。項目已在某市試點上線,后續將陸續在29個城市進行行業推廣,人大金倉將提供以全國各省為單位的7*24小時響應的本地化原廠實施和售后服務。
總結展望
人大金倉作為數據庫領域專業廠商,深知硬核能力是破局之道,新技術應用是發展之源,契合行業需求是生存之基。通過為用戶提供優質的數據庫產品與服務,助力軌道交通行業基于雙網段標準的列車自動控制系統國產化創新升級。驅動軌道交通行業國產化升級的高質量發展。