引言:備受期待的監(jiān)控易火星版進(jìn)入發(fā)布倒計(jì)時(shí)。今天,為大家介紹新版本的其中一個(gè)亮點(diǎn):IT基礎(chǔ)設(shè)施分布式運(yùn)維。
隨著人工智能、5G、物聯(lián)網(wǎng)、AI、云計(jì)算等各種新技術(shù)不斷出現(xiàn),互聯(lián)網(wǎng)設(shè)備接入數(shù)量快速增加。根據(jù)IDC《2021年網(wǎng)絡(luò)市場(chǎng)跟蹤報(bào)告》顯示,2021年全球網(wǎng)絡(luò)市場(chǎng)規(guī)模相比去年增長(zhǎng)10.1%,達(dá)到了542.4億美元。中國(guó)網(wǎng)絡(luò)市場(chǎng)規(guī)模為102.4億美元(約合660億元人民幣),與去年相比增長(zhǎng)12.1%,其中交換機(jī)、路由器和WLAN市場(chǎng)分別增長(zhǎng)17.5%、-2.6%和47.2%。
網(wǎng)絡(luò)規(guī)模的持續(xù)擴(kuò)張使IT運(yùn)維市場(chǎng)迎來(lái)不少發(fā)展機(jī)遇,各種IT運(yùn)維解決方案紛紛出爐。然而,目前推出的多是面向中小網(wǎng)絡(luò)的單機(jī)版運(yùn)維解決方案,相對(duì)于萬(wàn)臺(tái)以上量級(jí)的一體化運(yùn)維,以及規(guī)模小、分點(diǎn)多、終端分布散的上萬(wàn)臺(tái)設(shè)備的跨區(qū)域網(wǎng)絡(luò)運(yùn)維,這些方案并不一定適用。雖然國(guó)內(nèi)已經(jīng)發(fā)布了很多IT運(yùn)維解決方案,卻存在良莠不齊的情況。
海量設(shè)備運(yùn)維面臨的挑戰(zhàn)
每個(gè)行業(yè)技術(shù)水平和產(chǎn)品能力的提升,都需要大量研發(fā)人員和充足經(jīng)費(fèi)的持續(xù)投入。只有投入足夠的時(shí)間打磨產(chǎn)品,并參與項(xiàng)目落地實(shí)踐等,才能確保經(jīng)得住市場(chǎng)考驗(yàn)。ITOM領(lǐng)域的運(yùn)維廠(chǎng)商,大多都在緊跟各行業(yè)運(yùn)維需求變化升級(jí)產(chǎn)品、完善方案。但運(yùn)維廠(chǎng)商不同研發(fā)能力和研發(fā)投入的不同,必然導(dǎo)致梯隊(duì)的產(chǎn)生。
北京美信時(shí)代科技有限公司是ITOM領(lǐng)域亮眼的一道風(fēng)景線(xiàn)。美信時(shí)代創(chuàng)立于2007年,多次獲得業(yè)內(nèi)戰(zhàn)略投資,十五年來(lái)默守耕耘IT智能運(yùn)維及數(shù)據(jù)可觀(guān)測(cè)性領(lǐng)域,研發(fā)團(tuán)隊(duì)占公司人數(shù)的50%以上,在北京、南京和太原設(shè)有研發(fā)基地,并在上海、深圳、武漢、成都、鄭州等十多個(gè)城市設(shè)有技術(shù)服務(wù)中心,服務(wù)過(guò)的客戶(hù)包括國(guó)家某辦室、中石化、上海電力、江蘇交控等數(shù)千家大中型企事業(yè)單位。
作為ITOM專(zhuān)業(yè)廠(chǎng)商,美信時(shí)代推出的基于多TS架構(gòu)的分布式運(yùn)維解決方案,不同于業(yè)內(nèi)通用的單機(jī)版運(yùn)維模式,也不同于第三方運(yùn)維服務(wù)商提供的個(gè)性化、定制化集成運(yùn)維,架構(gòu)非常靈活,能快速適應(yīng)各種復(fù)雜拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò)。它克服了通用運(yùn)維方案的數(shù)據(jù)交互緩慢、邊緣數(shù)據(jù)采集延遲、老舊設(shè)備無(wú)法適配等問(wèn)題,為大規(guī)模海量設(shè)備的運(yùn)維管理提供最佳的高性能解決方案。
(圖片來(lái)源:千圖網(wǎng))
國(guó)內(nèi)以往的大規(guī)模分布式運(yùn)維實(shí)踐相對(duì)較少。最早在2013年,阿里在過(guò)萬(wàn)臺(tái)的跨集群擴(kuò)展的5K項(xiàng)目中面臨過(guò)巨大的運(yùn)維挑戰(zhàn),最終通過(guò)快速部署、自動(dòng)化運(yùn)維、監(jiān)控報(bào)警、Log分析和精細(xì)化計(jì)量等,實(shí)現(xiàn)了大規(guī)模海量設(shè)備分布式運(yùn)維的轉(zhuǎn)型。
面對(duì)成千上萬(wàn)臺(tái)、甚至數(shù)十萬(wàn)規(guī)模的運(yùn)維對(duì)象,運(yùn)維團(tuán)隊(duì)需要有更強(qiáng)大的整體把控能力,包括對(duì)機(jī)房、網(wǎng)絡(luò)、流量、硬件、服務(wù)器、中間件、應(yīng)用等進(jìn)行實(shí)時(shí)運(yùn)行狀態(tài)監(jiān)控,實(shí)現(xiàn)不同維度不同類(lèi)型資源的數(shù)據(jù)分析等,做到對(duì)網(wǎng)絡(luò)架構(gòu)、網(wǎng)絡(luò)節(jié)點(diǎn)、網(wǎng)絡(luò)鏈路、網(wǎng)絡(luò)設(shè)備、服務(wù)器及性能指標(biāo)等宏觀(guān)和微觀(guān)體系的了如指掌。面對(duì)海量運(yùn)維對(duì)象和監(jiān)測(cè)指標(biāo),單靠人力遠(yuǎn)遠(yuǎn)無(wú)法做到,必然需要借助自動(dòng)化、智能化的運(yùn)維管理工具和平臺(tái)。
大型行業(yè)用戶(hù)一體化集中運(yùn)維需求
目前,IT運(yùn)維(ITOM)廠(chǎng)商大都只能基于單機(jī)版產(chǎn)品對(duì)中小型IT網(wǎng)絡(luò)或機(jī)房進(jìn)行運(yùn)維,無(wú)法解決大型行業(yè)用戶(hù)對(duì)分布式IT網(wǎng)絡(luò)的監(jiān)管和運(yùn)維需求。而大規(guī)模海量設(shè)備監(jiān)控和運(yùn)維,正是監(jiān)控易一體化運(yùn)維系統(tǒng)的突出特點(diǎn),美信時(shí)代可以給出完美解決方案。
監(jiān)控易由諸多獨(dú)立模塊組成,包括設(shè)備管理、網(wǎng)絡(luò)管理、業(yè)務(wù)管理、視頻管理、CMDB、ITSM、運(yùn)維管理、機(jī)房管理、移動(dòng)運(yùn)維、云運(yùn)維、3D可視化等,支持各系統(tǒng)間的數(shù)據(jù)關(guān)聯(lián)共享,從全局視角把控系統(tǒng)運(yùn)行態(tài)勢(shì)。
監(jiān)控易覆蓋IT基礎(chǔ)設(shè)施、機(jī)房動(dòng)環(huán)和智能物聯(lián)網(wǎng)三大領(lǐng)域,可對(duì)各種網(wǎng)絡(luò)設(shè)備、安全設(shè)備、服務(wù)器、應(yīng)用軟件、存儲(chǔ)、虛擬化、云原生等進(jìn)行分布式、一體化管理,實(shí)現(xiàn)百萬(wàn)臺(tái)以上設(shè)備性能指標(biāo)快速采集和實(shí)時(shí)監(jiān)控。
適應(yīng)各種網(wǎng)絡(luò)的分布式運(yùn)維架構(gòu)
擁有大規(guī)模網(wǎng)絡(luò)的用戶(hù)單位,通常機(jī)房及辦公點(diǎn)分布在全國(guó)各地。比如,有十幾個(gè)分散各地的機(jī)房,或者幾十個(gè)辦公網(wǎng)絡(luò),或者幾萬(wàn)臺(tái)監(jiān)控對(duì)象。這些行業(yè)用戶(hù)網(wǎng)絡(luò)復(fù)雜、規(guī)模龐大,存在運(yùn)維難點(diǎn)和痛點(diǎn),想要高效進(jìn)行一體化監(jiān)控和運(yùn)維,最佳方案是通過(guò)分布式架構(gòu)來(lái)實(shí)現(xiàn)。
與行業(yè)里普遍提供的面向中小型網(wǎng)絡(luò)的單機(jī)版運(yùn)維軟件不同,監(jiān)控易可以為國(guó)內(nèi)TOP3000等大規(guī)模復(fù)雜網(wǎng)絡(luò)環(huán)境企業(yè)提供跨區(qū)域、跨網(wǎng)絡(luò)、跨安全域的IT基礎(chǔ)設(shè)施分布式運(yùn)維管理。監(jiān)控易底層數(shù)據(jù)庫(kù)、監(jiān)測(cè)器、中間件、消息隊(duì)列、WebServer、拓?fù)浒l(fā)現(xiàn)、報(bào)表管理、北向接口等核心功能組件均為自主研發(fā),能夠監(jiān)測(cè)10萬(wàn)+數(shù)據(jù)量級(jí)的網(wǎng)絡(luò)環(huán)境,滿(mǎn)足各種分布式的部署需求。
分布式數(shù)據(jù)采集模式
監(jiān)控易系統(tǒng)為BS架構(gòu),底層采用分布式架構(gòu)設(shè)計(jì),各地?cái)?shù)據(jù)中心或機(jī)房可部署監(jiān)控終端(TS),監(jiān)控終端自帶高性能數(shù)據(jù)庫(kù),設(shè)備監(jiān)控指標(biāo)的采集在監(jiān)控終端完成。監(jiān)控終端的狀態(tài)數(shù)據(jù)和告警數(shù)據(jù)上傳到集中管理控制臺(tái)(CCU),該模式所消耗網(wǎng)絡(luò)資源為最小,幾百設(shè)備監(jiān)控只占用十幾K帶寬。CCU和TS共同組成監(jiān)控易獨(dú)特的分布式協(xié)同計(jì)算架構(gòu),在保證帶寬最小占用、高性能數(shù)據(jù)采集和一體化監(jiān)控的情況下,支持對(duì)采集數(shù)據(jù)的綜合數(shù)據(jù)分析和協(xié)同計(jì)算。
所有監(jiān)控對(duì)象和指標(biāo)通過(guò)CCU進(jìn)行統(tǒng)一展示。CCU可在瀏覽器直接訪(fǎng)問(wèn),有統(tǒng)一的登錄入口,每個(gè)登錄用戶(hù)有自己的Portal展示界面。視圖、圖表展示和告警都是分布式采集數(shù)據(jù),集中展現(xiàn)和管理。
分布式架構(gòu)也可分散監(jiān)控負(fù)載??刂票O(jiān)測(cè)云中的TS監(jiān)測(cè)服務(wù)器根據(jù)數(shù)量和計(jì)算能力動(dòng)態(tài)承擔(dān)各自的監(jiān)測(cè)任務(wù)。當(dāng)數(shù)量和計(jì)算能力發(fā)生變化時(shí),通過(guò)自動(dòng)調(diào)節(jié)機(jī)制去重新調(diào)整各自的監(jiān)測(cè)任務(wù)量。
監(jiān)控易分布式數(shù)據(jù)采集架構(gòu)
通常情況下,監(jiān)控易一個(gè)Task Server分布式數(shù)據(jù)采集器可以實(shí)現(xiàn)對(duì)近萬(wàn)臺(tái)服務(wù)器(或者網(wǎng)絡(luò)設(shè)備)的監(jiān)測(cè)。任務(wù)管理器所管理下的監(jiān)測(cè)服務(wù)器組成監(jiān)測(cè)云,完成對(duì)大規(guī)模設(shè)備的海量監(jiān)控。該監(jiān)測(cè)云具備動(dòng)態(tài)監(jiān)測(cè)負(fù)載均衡、多機(jī)容災(zāi)備份、監(jiān)測(cè)服務(wù)器熱插拔等眾多功能。
監(jiān)控易自研的BigRiver實(shí)時(shí)高效率時(shí)序數(shù)據(jù)庫(kù),主要實(shí)現(xiàn)對(duì)海量監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)存儲(chǔ)和報(bào)表數(shù)據(jù)的生成,基于高效緩存機(jī)制、頁(yè)式存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)監(jiān)控?cái)?shù)據(jù)的高效處理和存儲(chǔ)。BigRiver的優(yōu)勢(shì)是訪(fǎng)問(wèn)速度快,緩存命中率極高,高壓縮算法使得數(shù)據(jù)庫(kù)文件只有傳統(tǒng)數(shù)據(jù)庫(kù)的1/20。
分布式運(yùn)維方案特性
監(jiān)控易的分布式架構(gòu)支持多場(chǎng)景部署模式。三層部署架構(gòu)既保證了跨地區(qū)、跨網(wǎng)絡(luò)的統(tǒng)一管理,也支持部署架構(gòu)的橫向、垂直拓展,有助于行業(yè)用戶(hù)進(jìn)行更為精細(xì)化的數(shù)據(jù)采集以及業(yè)務(wù)的擴(kuò)張。工業(yè)4.0時(shí)代,傳統(tǒng)的網(wǎng)絡(luò)構(gòu)型已經(jīng)不能滿(mǎn)足日益增加的細(xì)分應(yīng)用場(chǎng)景,網(wǎng)絡(luò)呈現(xiàn)多種部署模式將會(huì)是常態(tài),具備多TS分布式架構(gòu)的監(jiān)控易一體化運(yùn)維管理平臺(tái),可以更靈活地適應(yīng)各種組網(wǎng)模式。
比如,某電力項(xiàng)目全網(wǎng)監(jiān)控需要穿越保密程度很高、相互隔離的網(wǎng)閘,這個(gè)技術(shù)難度系數(shù)較大,一般的運(yùn)維方案很難解決,但監(jiān)控易可以提供應(yīng)對(duì)的策略。該電力網(wǎng)絡(luò)比較復(fù)雜,分為1區(qū)、2區(qū)、3區(qū)、4區(qū),每個(gè)區(qū)段的加密級(jí)別都不一樣;1區(qū)不能訪(fǎng)問(wèn)2區(qū),有訪(fǎng)問(wèn)限制。在保證符合用戶(hù)安全管理要求的前提下,跨網(wǎng)閘隔離網(wǎng)絡(luò)不管是1、2區(qū)還是3、4區(qū),監(jiān)控易通過(guò)一個(gè)平臺(tái),就可將所有網(wǎng)絡(luò)資源統(tǒng)一監(jiān)控并展示出來(lái)。
ITOM領(lǐng)域通用運(yùn)維方案單點(diǎn)監(jiān)控最高到3000臺(tái)設(shè)備就會(huì)運(yùn)行緩慢、性能下降,監(jiān)控易一臺(tái)服務(wù)器能輕松監(jiān)控上萬(wàn)臺(tái)設(shè)備并保持長(zhǎng)期穩(wěn)定運(yùn)行;通用運(yùn)維軟件僅能實(shí)現(xiàn)分鐘級(jí)輪詢(xún),監(jiān)控易可以實(shí)現(xiàn)秒級(jí)輪詢(xún);通用運(yùn)維軟件存儲(chǔ)歷史數(shù)據(jù)過(guò)多會(huì)影響性能,監(jiān)控易可存儲(chǔ)海量數(shù)據(jù)卻不受影響。
無(wú)論是復(fù)雜的網(wǎng)絡(luò)還是分布各地的零散終端,無(wú)論是公有網(wǎng)絡(luò)還是私有網(wǎng)絡(luò),只要有一個(gè)向外的接口,通過(guò)監(jiān)控易一體化運(yùn)維管理平臺(tái),就能將網(wǎng)絡(luò)內(nèi)所有資源運(yùn)行狀況全部納入監(jiān)管。
基于多TS的分布式架構(gòu),是監(jiān)控易有別于ITOM領(lǐng)域其他運(yùn)維廠(chǎng)商極其明顯的一個(gè)特點(diǎn)。通過(guò)內(nèi)部網(wǎng)絡(luò)中的某一個(gè)可聯(lián)網(wǎng)設(shè)備,監(jiān)控易就能實(shí)現(xiàn)異地網(wǎng)絡(luò)的所有連接和性能數(shù)據(jù)采集,將分布在各地的網(wǎng)絡(luò)資源全部監(jiān)控起來(lái)。通過(guò)監(jiān)控易的分布式架構(gòu),還可以將用戶(hù)分布在全國(guó)各地的百萬(wàn)級(jí)IP地址進(jìn)行管理。
相比傳統(tǒng)運(yùn)維模式,監(jiān)控易分布式架構(gòu)更為靈活,能適應(yīng)各種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。對(duì)于大型網(wǎng)絡(luò)和復(fù)雜環(huán)境,部分運(yùn)維廠(chǎng)商也提供了分布式部署,但多是以每個(gè)分布網(wǎng)點(diǎn)或局域網(wǎng)單獨(dú)部署一套產(chǎn)品的方式來(lái)解決集中監(jiān)控需求。如果監(jiān)控對(duì)象數(shù)量眾多、分布網(wǎng)點(diǎn)較多的話(huà),一開(kāi)始運(yùn)維系統(tǒng)總體性能影響并不明顯,但運(yùn)行一段時(shí)間后,同時(shí)部署多套運(yùn)維產(chǎn)品導(dǎo)致的網(wǎng)絡(luò)卡頓和延遲、性能緩慢等問(wèn)題終會(huì)顯露。這種分布式部署模式,與監(jiān)控易只需部署一套平臺(tái)、集中式、一體化數(shù)據(jù)采集和運(yùn)維,完全不同。
除此之外,監(jiān)控易分布式架構(gòu)平臺(tái)還具備其他優(yōu)良特性:良好的拓展性、監(jiān)測(cè)數(shù)據(jù)先寫(xiě)入緩存再入庫(kù)減小寫(xiě)入壓力、64位尋址提升數(shù)據(jù)讀取效率、低代碼開(kāi)發(fā)環(huán)境使開(kāi)發(fā)人員能夠以更大的自由度進(jìn)行定制。
分布式運(yùn)維,推薦監(jiān)控易
現(xiàn)在,監(jiān)控易幾乎成為了分布式、大規(guī)模、海量設(shè)備運(yùn)維的代名詞,典型案例如上海電力、江蘇交控、國(guó)家某室辦、某大型重工企業(yè)、某大型制造業(yè)全國(guó)25個(gè)園區(qū)的基礎(chǔ)設(shè)施集中監(jiān)控等。而縱觀(guān)國(guó)內(nèi)ITOM領(lǐng)域,大多數(shù)運(yùn)維廠(chǎng)商技術(shù)能力還達(dá)不到對(duì)復(fù)雜網(wǎng)絡(luò)的集中運(yùn)維,無(wú)法提供有效的解決方案。
勇于突破和創(chuàng)新,是美信時(shí)代公司的技術(shù)基因,其技術(shù)研發(fā)能力一直走在行業(yè)前沿。雖然各家運(yùn)維廠(chǎng)商都會(huì)推出不同行業(yè)、不同場(chǎng)景的解決方案,但由于功能模塊和技術(shù)前沿能力各不相同,市場(chǎng)側(cè)重點(diǎn)必然有所不同。當(dāng)單機(jī)版解決方案在運(yùn)維中面臨性能問(wèn)題、效率問(wèn)題時(shí),可以試試監(jiān)控易分布式部署架構(gòu),它將實(shí)現(xiàn)運(yùn)維效率質(zhì)的飛躍。
結(jié)語(yǔ)
工業(yè)4.0時(shí)代的推進(jìn),必然使得各行業(yè)網(wǎng)絡(luò)規(guī)模體量越來(lái)越大。美信監(jiān)控易多TS架構(gòu)分布式運(yùn)維,為大規(guī)模海量設(shè)備監(jiān)控和運(yùn)維提供了可以借鑒的經(jīng)驗(yàn)和實(shí)踐。只有解決了海量設(shè)備數(shù)據(jù)庫(kù)實(shí)時(shí)存儲(chǔ)和計(jì)算、快速適配大量不同型號(hào)和協(xié)議的設(shè)備、跨區(qū)域跨網(wǎng)絡(luò)跨安全域等一系列運(yùn)維難點(diǎn),才能真正意義上實(shí)現(xiàn)大規(guī)模網(wǎng)絡(luò)的分布式運(yùn)維,跨越大企業(yè)運(yùn)維管理鴻溝。
關(guān)于監(jiān)控易:
監(jiān)控易是美信時(shí)代自研的分布式、一體化數(shù)據(jù)采集與洞察管理平臺(tái),采用多TS架構(gòu),集中統(tǒng)一實(shí)現(xiàn)IT、動(dòng)環(huán)、智能物聯(lián)網(wǎng)等智能設(shè)備和軟硬件系統(tǒng)的自動(dòng)采集、監(jiān)測(cè)、巡檢、告警及展現(xiàn),提供設(shè)備管理、網(wǎng)絡(luò)管理、業(yè)務(wù)管理、視頻管理、CMDB、ITSM、運(yùn)維管理、機(jī)房管理、移動(dòng)運(yùn)維、云運(yùn)維、3D可視化等核心功能,支持各系統(tǒng)間的數(shù)據(jù)關(guān)聯(lián)共享,從全局視角把控系統(tǒng)運(yùn)行態(tài)勢(shì)。監(jiān)控易具備全國(guó)產(chǎn)、高性能、一體化、多層級(jí)的特點(diǎn),聚焦IT&OT領(lǐng)域,處于信創(chuàng)產(chǎn)業(yè)鏈中“卡脖子”的戰(zhàn)略環(huán)節(jié)。