1.時序數據的挑戰
在數據中心IT運維管理中,流量數據的分析價值越來越受到用戶的重視,目前用戶通過對數據中心進行全流量采集,可實現網絡、業務及安全的實時監控分析,實時刷新精度可達到秒級,并快速發現數據中心產生的異常數據。監控數據采用時序數據處理,可實時繪制不同維度上百個指標的趨勢變化。數據中心每天會產生上百億的數據條目,達到PB級的流量數據。
運維人員在進行長時間的數據檢索時,會面臨效率較低的問題,并且數據存儲時長難以保障。所以面對一些數據消費場景時,時序數據的處理很難滿足運維需求。在用戶數據中心內,業務調用關系復雜,當業務系統要做遷移操作時,遷移后要保證該業務系統對外提供的所有服務與原有保持一致,而運維人員往往很難掌握業務系統之間的調用關系。所以要通過流量數據提供一份準確的訪問關系表,這張關系表不關注是在哪個時間進行調用以及過多的性能指標,只需要知道有誰跟本系統發生了訪問關系。另外,當某個服務要做變更操作時,也需要歷史數據的支撐來判斷該服務的影響范圍。為解決上述問題,客戶往往提出如下需求:
1、數據存儲時間要長,有些業務調用可能周期性一周、一個月才來調用一次,或者更長周期,只有長的時間的跟蹤才能保證數據的準確性。
2、數據要完整,由于時序數據數據量巨大,往往會采取抽樣、或者TOP的方式來提供服務,不能保障數據的完整性。
3、查詢性能,在海量的數據中進行查詢,會導致消耗大量系統資源,給數據承載的系統帶來巨大的壓力。
2.運維時效數據解決方案
為了滿足更長時間精準統計數據需求,智維數據推出時效數據解決方案。將時序數據轉化為時效數據,提供長時間、高效、靈活的查詢統計服務。
該解決方案的特點有:
1、數據保留期限長
時序數據數據量巨大,存儲存滿后系統會自動刪除最早的數據,因此保存期限較短。時效數據將時序數據進行有效的聚合、去重以及壓縮,經測試平均每天可處理50萬條數據,90天可處理的數據量大概在4500萬條,經過聚合、去重,數據的存儲量大概在200萬左右,極大程度的壓縮了數據存儲量。
2、全量數據統計
智維數據nCompass網絡流量分析平臺從數據采集到數據處理,沒有經過抽樣、TOP的處理方式,可以保證數據的完整性以及準確性。
3、緯度、指標可靈活組合
時序數據提供眾多緯度和指標,用戶可根據需求自定義生成時效數據,通過緯度及指標過濾精準輸出。
選擇時效數據緯度及指標
過濾時效數據緯度及指標
4、提供靈活的數據服務接口
時效數據除了在智維數據nCompass網絡流量分析平臺上進行本地數據消費外,還提供了標準的API接口,供外部應用調用。
3.時效數據消費場景
1、業務系統交互查詢
應用運維中業務交互關系數據可為很多場景中提供數據支撐,例如:系統變更、遷移、上下線、故障排查等。通過流量和CMDB數據縫合,提供時序數據以及時效數據無縫查詢。
【上圖為demo數據演示】
2、防火墻策略優化
智維數據nCompass防火墻策略可視化平臺通過防火墻策略及防火墻前后的流量匹配關聯,幫助用戶優化防火墻策略,如無命中的策略、大策略收斂等場景都需要長時間的時效數據進行校準,才能夠精準的對策略進行優化,避免由于策略刪除、收斂產生的問題。
【上圖為demo數據演示】
3、業務訪問安全防護欄桿
內網業務系統交互關系變化相對較小,通過時效數據自動生成業務交互訪問白名單,對業務交互關系變化實時監控,如有新增訪問,平臺將通過告警或報表的形式進行輸出,運維人員可及時排查新增訪問是否合規或者是否存在安全隱患。
4、出訪記錄安全回溯
基于安全合規要求,運維人員需要在平臺上對所有出訪記錄進行保存半年或一年以上時間,智維數據靈瓏應用交付優化平臺能夠采集負載均衡、防火墻、路由器等設備的地址轉換關系表,并可與流量數據進行縫合。并且可以提供內網IP至目的IP,SANTIP至目的IP長時間的歷史回溯。
面對運維中多樣的數據統計需求,時效數據的運用提升了長時間數據的統計檢索能力,幫助用戶從海量數據中精準提取,同時大大節省了存儲成本。通過對時序數據再加工生成時效數據,充分發揮了流量數據在運維工作中的使用價值。