隨著國內(nèi)產(chǎn)業(yè)升級進(jìn)入深水區(qū),數(shù)字化成為一個(gè)繞不過去的命題,智能運(yùn)維卻成了新的問題。在信創(chuàng)產(chǎn)業(yè)如火如荼地發(fā)展過程中,一個(gè)難題橫亙在所有企業(yè)面前:提升整個(gè)運(yùn)維系統(tǒng)的“可觀測性”。
或許有人會問,“可觀測性”不就是監(jiān)控?這是很早就用于保障數(shù)字化運(yùn)維的基石。但此處需要提及的是,傳統(tǒng)監(jiān)控已經(jīng)無法應(yīng)對時(shí)代背景下的數(shù)字化運(yùn)維。
信創(chuàng)泥潭:
在智能終端海洋中迷路
在產(chǎn)業(yè)數(shù)字化升級的進(jìn)程中,“可觀測性”逐漸聲名鵲起,成為一個(gè)備受追捧的熱詞??捎^測性區(qū)別于傳統(tǒng)意義上的監(jiān)控,被視為對運(yùn)維系統(tǒng)更自動(dòng)化、智能化的洞察。
這種情況并不難理解,“可觀測性”走入產(chǎn)業(yè)視野,一方面是由于產(chǎn)業(yè)升級造就的更為豐富的IT場景,另一方面則是由于信創(chuàng)產(chǎn)業(yè)提供了大量的設(shè)施迭代。
二者的合力,讓信創(chuàng)在不同時(shí)期,在細(xì)分領(lǐng)域上形成不同的側(cè)重。如信創(chuàng)前期的重硬件輕軟件,到2019-2020年間中間件發(fā)展跨上快車道,如同寶劍開刃一般讓更多基礎(chǔ)設(shè)施得以物盡其用,信創(chuàng)產(chǎn)業(yè)也快速進(jìn)入了推廣期。
大量信創(chuàng)智能終端進(jìn)入生產(chǎn)場景,卻逐漸催生了新的問題:
為了維護(hù)設(shè)備的穩(wěn)定運(yùn)行,通常應(yīng)用監(jiān)控的方式最大限度消弭設(shè)備故障的可能性,實(shí)現(xiàn)運(yùn)維工作的平穩(wěn)進(jìn)行;但是IT環(huán)境的復(fù)雜化,打破了這一切。
在傳統(tǒng)的監(jiān)控概念中,設(shè)備需要儀表板、傳感器一類的元件,來反映機(jī)器運(yùn)行的健康狀況。這樣的傳統(tǒng)監(jiān)控,只能針對設(shè)計(jì)者預(yù)設(shè)的故障進(jìn)行基礎(chǔ)檢測,隨著IT設(shè)備越來越智能、越來越多樣化,需要預(yù)設(shè)更多的“故障情況”,就如同打拳擊重點(diǎn)布防幾個(gè)對方習(xí)慣出拳的位置,并不能應(yīng)對所有打擊。這也使得監(jiān)控變得越來越復(fù)雜、成本越來越高。越是引入IT設(shè)備,越是增本而不增效,對擁有豐富運(yùn)維經(jīng)驗(yàn)的專家越是依賴。這樣落后的運(yùn)維方式,本質(zhì)上并沒有激發(fā)信創(chuàng)產(chǎn)品的優(yōu)勢。
中國工程院院士倪光南指出,國產(chǎn)自主可控替代,一定不是落后替代落后,而是是先進(jìn)替代落后??捎^測性就是國產(chǎn)替代的下一個(gè)方向,也是邁向先進(jìn)的一大步。信創(chuàng)產(chǎn)業(yè)自然開始傾向于將“可觀測性”作為未來產(chǎn)品力重要組成部分。
客觀上說,“可觀測性”意味著設(shè)備由只能對特定數(shù)據(jù)監(jiān)控、被動(dòng)巡檢來暴露問題,質(zhì)變?yōu)樵O(shè)備自查、主動(dòng)匯報(bào)問題所在。
實(shí)現(xiàn)“可觀測性”
需要攀這幾座高山
“可觀測性”并不是什么新鮮概念,但并不易于實(shí)現(xiàn)。在基礎(chǔ)設(shè)施協(xié)同趨向“云邊端一體化”發(fā)展的今天,這個(gè)需求被史無前例地拔高。“云邊端一體化”帶來了數(shù)據(jù)庫等軟件的分布式部署,誕生對數(shù)據(jù)定位、數(shù)據(jù)展現(xiàn)的訴求。要達(dá)到這樣的效果,這幾座高山必須翻過。
首先需要克服數(shù)據(jù)孤島。在信創(chuàng)初期,產(chǎn)品如過江之鯽般面市,但依舊停留在對已有設(shè)備的沿襲,而不是遵循新的標(biāo)準(zhǔn)范式、為運(yùn)維生態(tài)所容納,兼容性不足、數(shù)據(jù)彼此不互通就成為信創(chuàng)早期的通病。這對于“可觀測性”的建立來說是致命的,數(shù)據(jù)孤島的無序增殖強(qiáng)行將企業(yè)拖回到投入人力維護(hù)的陷阱中。
其次是提升對“未知未知數(shù)”的應(yīng)對能力。傳統(tǒng)監(jiān)控解決的問題,是反饋“確定的未知”,即“我知道你可能會出問題”。沿襲這個(gè)思路打造的監(jiān)控系統(tǒng)極度依賴人力,很多進(jìn)行國產(chǎn)替代的廠商都有過“數(shù)千運(yùn)維人員坐等故障”的血淚經(jīng)歷。“可觀測性”要解決的問題,則是“我不知道將出現(xiàn)什么問題,但我有足夠的自查、讓專家介入的能力”。事實(shí)上,通過技術(shù)手段描繪系統(tǒng)更全面的狀態(tài),將“系統(tǒng)的‘可觀測性’”放在一個(gè)更高的位置,已經(jīng)成為了近幾年IT架構(gòu)設(shè)計(jì)的風(fēng)向,力爭做到“研發(fā)走一小步,省去運(yùn)維走十步”的效果。
再者是提升數(shù)據(jù)可視化的能力。畢竟人不是機(jī)器,人對一張拓?fù)鋱D的辨識能力遠(yuǎn)遠(yuǎn)高于識別機(jī)器隨機(jī)生成的日志。數(shù)據(jù)可視化,是便于人對硬件的強(qiáng)介入,通過提升人對硬件運(yùn)作的參與效率來降低運(yùn)維的難度。
可以說,沒有全局視角,沒有人與設(shè)備的高效互動(dòng),可觀測性就無從談起。不少企業(yè)缺乏通用的全局智慧運(yùn)維方案,只能進(jìn)行局部數(shù)字化,加劇信息孤島的同時(shí)還偏離“可觀測性”越來越遠(yuǎn),這也是他們“越智能化成本越高”的癥結(jié)所在。
廣泛賦予用戶“可觀測性”
美信時(shí)代強(qiáng)力塑造“被集成”能力
“可觀測性”的風(fēng)暴,也逐漸影響到數(shù)字化服務(wù)商。信創(chuàng)藍(lán)海中,將“可觀測性”這一放在業(yè)界也顯前沿的概念,擴(kuò)展到to B數(shù)字服務(wù)領(lǐng)域,這對數(shù)字化服務(wù)商提出了更為苛刻的需求,因?yàn)橥ㄓ眠\(yùn)維解決方案需要在不同信創(chuàng)場景滿足上述“可觀測性”要求。能被用戶“集成”到整體業(yè)務(wù)中的智慧運(yùn)維方案,才足以應(yīng)對下一階段信創(chuàng)的挑戰(zhàn)。
為應(yīng)對未來需求,美信時(shí)代一直將“被集成”作為打造智慧運(yùn)維方案監(jiān)控易的重點(diǎn),提供用戶掌握、易用、好用的智能運(yùn)維平臺,從全局賦能信創(chuàng)產(chǎn)品用戶“可觀測性”。
Big River四合一超融合數(shù)據(jù)庫
著眼于整體IT環(huán)境發(fā)揮數(shù)據(jù)價(jià)值,應(yīng)對復(fù)雜的數(shù)據(jù)存儲處理需求,是方案能為企業(yè)用戶廣泛應(yīng)用的基礎(chǔ)。“可觀測性”的基礎(chǔ)是數(shù)據(jù)庫,數(shù)據(jù)孤島可能產(chǎn)生在任何產(chǎn)業(yè)數(shù)字化迭代的進(jìn)程當(dāng)中。目前市面上的傳統(tǒng)數(shù)據(jù)庫,如關(guān)系型數(shù)據(jù)庫,多為早期單一業(yè)務(wù)場景設(shè)計(jì),已經(jīng)顯著落后于時(shí)代需求,卻仍然在IT領(lǐng)域有大規(guī)模應(yīng)用。根據(jù)《2021年中國信創(chuàng)生態(tài)市場研究報(bào)告》中的調(diào)研統(tǒng)計(jì)數(shù)據(jù),從用戶需求來看,用戶對數(shù)據(jù)庫、企業(yè)應(yīng)用軟件、安全軟硬件方面的需求顯著高于其他信創(chuàng)細(xì)分領(lǐng)域。成熟的to B“被集成”解決方案,就不得不考慮用戶構(gòu)成的復(fù)雜性。
應(yīng)對復(fù)雜應(yīng)用環(huán)境的超融合數(shù)據(jù)庫幾乎都會成為產(chǎn)業(yè)的最終選擇。美信時(shí)代根據(jù)深耕數(shù)據(jù)庫領(lǐng)域多年,自主研發(fā)Big River四合一超融合數(shù)據(jù)庫,集表狀數(shù)據(jù)庫、KV數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、時(shí)序數(shù)據(jù)庫于一體,這讓基于Big River數(shù)據(jù)庫打造的監(jiān)控易在洞察設(shè)備上具備先天優(yōu)勢。數(shù)據(jù)庫支持分布式部署,更利于信創(chuàng)硬件產(chǎn)品云邊端一體化部署,有效解決了數(shù)據(jù)孤島的問題,可監(jiān)控設(shè)備各種類型的日志信息。這讓幾乎所有進(jìn)行數(shù)字化升級的用戶,都能觸及故障設(shè)備最基本的病兆——事件信息,都可以針對麾下的設(shè)備定制智慧運(yùn)維方案。
以用戶整個(gè)監(jiān)控網(wǎng)絡(luò)生態(tài)為前提部署智能運(yùn)維方案,下一步亟待解決監(jiān)控的效率問題。“云邊端一體化”的核心意義在于打破“事無巨細(xì)”的低效運(yùn)維,讓信息的初步篩查、存儲完成在本地,同時(shí)支持檢索,而只保留反映系統(tǒng)運(yùn)行狀態(tài)的參數(shù)并反饋到一體化運(yùn)維中心,這也符合“可觀測性”的發(fā)展要求。運(yùn)維系統(tǒng)運(yùn)行過程中,“可觀測性”往往誕生在存儲、衡量、檢索這三個(gè)核心動(dòng)作交融的過程,數(shù)據(jù)庫若不能高效處理這些操作則不具備一體化部署和可觀測的條件,這就對監(jiān)控平臺的性能提出了較高的要求。監(jiān)控易則能實(shí)現(xiàn)多元異構(gòu)數(shù)據(jù)的快速處理與響應(yīng),支持10萬+超大規(guī)模高性能設(shè)備的監(jiān)控運(yùn)維,實(shí)現(xiàn)海量設(shè)備、協(xié)議的高效對接,成為了被用戶全局集成的基礎(chǔ)。
“可觀測性”最重要的一環(huán),是讓用戶將專家經(jīng)驗(yàn)與監(jiān)控結(jié)果有效互動(dòng)?;?dòng)的結(jié)果,是人與系統(tǒng)的共同成長。對于工程師而言,好的系統(tǒng)不是設(shè)計(jì)出來的,是長出來的。這話還包含了另一個(gè)意思,就是——設(shè)計(jì)并不能解決一切未知的問題。對于監(jiān)控運(yùn)維而言,讓人理解、讓人歸因的意義遠(yuǎn)遠(yuǎn)大于解決故障本身,因?yàn)檫@可以讓決策者在規(guī)劃投入時(shí)更有側(cè)重。數(shù)據(jù)可視化就成為了“可觀測性”的重要一環(huán)。監(jiān)控易就做到了可自動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),將網(wǎng)絡(luò)中的邏輯連接關(guān)系以拓?fù)湟晥D展示,準(zhǔn)確暴露故障設(shè)備及其異常信息,便于用戶處理運(yùn)維問題同時(shí)對全生產(chǎn)鏈進(jìn)行優(yōu)化,在提升人效的同時(shí)對數(shù)字資產(chǎn)進(jìn)行管理配置。監(jiān)控易在其中作為全生態(tài)的觀察者、告警者和參謀,而不是僅僅梳理單條業(yè)務(wù)線。
通過持續(xù)強(qiáng)化數(shù)據(jù)底座、平臺性能和數(shù)據(jù)可視化能力,監(jiān)控易具備了能被多個(gè)產(chǎn)業(yè)領(lǐng)域納為生態(tài)高度智慧運(yùn)維方案的基礎(chǔ),為多個(gè)領(lǐng)域的用戶打開了產(chǎn)業(yè)升級的大門。目前,監(jiān)控易已經(jīng)廣泛運(yùn)用于政府、軍工、金融、電力、石油石化、交通、醫(yī)療等多個(gè)領(lǐng)域。監(jiān)控易支持低代碼開發(fā),大大降低了產(chǎn)品應(yīng)用于產(chǎn)業(yè)的門檻,也為其“被集成”屬性畫下了注腳。今后這種“被集成”能力也會成為對數(shù)字化服務(wù)商的核心要求,以形成對產(chǎn)業(yè)數(shù)字化升級的合力。
宏觀來說,“可觀測性”是從體系上讓設(shè)備變得更“聰明”;對“可觀測性”的強(qiáng)調(diào),也標(biāo)志著國內(nèi)信創(chuàng)產(chǎn)業(yè)邁入了新的大門,對人效、IT布局的成長性都提出了更高的要求,這也是信創(chuàng)產(chǎn)業(yè)逐漸退出試點(diǎn)期、進(jìn)入推廣期的一個(gè)必然結(jié)果。