對于數據可視化,相信大家都不陌生。不管是眾人皆知的雙11、雙12電商數據大屏,還是最近大家關注的疫情數據可視化,都是直接將我們關注的數據,通過各種分析圖表和看板,更加直觀地呈現在我們眼前。讓我們更容易去查看數據的趨勢,去記住并理解數據。
什么是實時數據可視化?
很多人,可能不禁要問,數據可視化不就是把數據通過柱形圖、餅圖、折線圖等圖表展示出來嗎?這個看起來并不復雜。
是的,大家有這種想法很正常。特別是各位“表哥表姐”,伴隨著“9毛9學Python”的浪潮,大家已經突破Excel的圖表,通過Python嘗試學習制作各種更加復雜、美觀的圖表了。
然而,大家日常用的圖表,大部分的數據對實時性要求并不是很高,我們把這一類數據稱為靜態數據。因為它們在相對較長的時間內不會變化,可能更新時間是一天,甚至更久。然而,在我們的生產生活中,更多使用的都是動態數據,就是需要經常更新和變化的數據。動態數據是指在系統應用中隨時間變化而改變的數據,如庫存數據等。電商雙11的數據統計,也是類似的場景,天貓的數據大屏上顯示的成交額數字,就是采集到大家下單和支付的數據,直接推送到數據大屏上的。大家看到的數據,就是實時動態更新的真實數據。
動態數據和時間變化緊密相關,能夠直接反映事務發生過程,比如,網站訪問量、在線人數、實時銷售額等等。在很多可視化場景中,對于時間變化頻率要求很高,需要達到秒級甚至毫秒級,這就是實時數據可視化。實時數據就是動態數據中非常有代表性的數據,也是生產制造、電商、金融、互聯網等眾多行業最為關注的數據。他們需要密切關注實時數據,一旦數據延遲,會造成不可估量的損失。
實時數據可視化的實現原理
實時數據(RTD)是在收集后立即傳遞的信息,通過設備、采集器或其他平臺所提供信息即時被“消費”,沒有延遲。實時數據通常用于監控或跟蹤,以及實時計算和分析的場景。舉個例子,生產車間要實時監控產線的運行狀態和生產情況,設備的運行數據就需要實時采集,同時通過數據可視化來監控。發生異常時需要第一時間進行報警。車間常用的MOM管理指揮中心的數據,就是通過這種機制來實現的。
下面以 Wyn 商業智能軟件為例,為大家普及下關于實時數據可視化的實現原理。
在Wyn Enterprise中,提供了兩種用于動態數據可視化的數據集:推送數據集和流式數據集。我們來了解一下這兩個數據集之間的區別。
1.推送數據集:
使用推送數據集,數據將直接推送到Wyn Enterprise服務中。Wyn Enterprise服務在接收到數據后,會自動創建一個數據表用來存儲數據集。因為有一個服務會不斷的將數據傳入進行存儲。所以,我們每次查看圖表時,數據集所查詢到的數據都是最新的。可以用于報警、數據刷新等場景。
推送數據集的更新,是通過數據集的定時刷新觸發的數據更新。使用推送數據集后,結合定時刷新將數據實時展示到儀表板中,達到實時展示的效果。
2.流式處理數據集:
使用流式處理數據集,數據也會被直接推送到 Wyn 服務中。Wyn 服務在接收到數據后,會自動創建一個數據緩存。與推送數據集有個本質的區別;就是流式處理數據集不會創建數據表,只會臨時存儲到緩存中,根據設定存儲時間會過期,過期后則數據自動清空。臨時緩存僅僅用于展示一些歷史存在過的數據,只用來表示數據歷史,如一個小時內的空氣質量檢測,一個小時內的設備運行狀態等,或是實時顯示出一個小時內數據的折線圖等效果圖。
在實際應用中,流式數據集對象適合處理最小化數據,對于時間維度來說具有非常強的表現能力,可以直觀地顯示出所推送的數據。
實時數據可視化的趨勢
目前,在很多業務場景中,用戶需要查看業務指標的實時數據大小,已經對數據展示的時效性提出了更高的要求。事實上,實時數據可視化在我們身邊有各種各樣的應用場景,隨著物聯網技術、5G技術的發展,實時數據可視化的場景將越來越多。比如工業領域的實時環境指標觀測、產品生產加工的實時監測、金融領域的股票證券交易數據實時展示、城市交通路況的實時監測等。隨著IoT概念的逐漸升溫,會有更多行業的各種業務場景對實時數據可視化提出更高的要求。因此,不難預見,在商業智能領域,實時數據可視化將為以智能制造、智慧園區、智慧金融等領域為代表的“智慧+”企業的數字化轉型帶來更多的價值。