后疫情時代,由于PC機在批量運維、安全治理等多方面存在管理弊端,大規(guī)模遠程移動辦公逐步成為一種核心訴求,而傳統(tǒng)IT架構(gòu)卻無法很好滿足。
桌面云憑借較好的數(shù)據(jù)安全保障能力、管理便捷性和運維效率,為數(shù)字化辦公提供了有力支撐。
國內(nèi)外桌面云智能運維現(xiàn)狀
國內(nèi)桌面云運維方案多以平臺和業(yè)務(wù)管理為主,主流的服務(wù)商一般都具備資源管理、系統(tǒng)監(jiān)控、權(quán)限管理、硬件管理等能力。但在大規(guī)模數(shù)據(jù)智能分析、全棧數(shù)據(jù)監(jiān)控領(lǐng)域、數(shù)據(jù)與桌面治理聯(lián)動等層面,各個服務(wù)商發(fā)力點不同,這也是當(dāng)前云桌面全棧智能運維的核心痛點,即:如何聯(lián)動桌面云產(chǎn)生的大規(guī)模數(shù)據(jù),實現(xiàn)桌面云系統(tǒng)全棧的自動化監(jiān)控、分析與治理。
國外桌面云服務(wù)商,總體向智能化分析診斷邁進得更早。除了具備平臺管理能力外,一般還具備智能化監(jiān)控和處理能力,如收集CPU使用量、內(nèi)存、數(shù)據(jù)存儲、磁盤、虛擬磁盤、網(wǎng)絡(luò)、電源、磁盤空間、存儲以及摘要衡量指標,利用AI技術(shù)進行容量預(yù)測、異常檢測、智能告警甚至根因分析等。
在整體的智能化運維方案和功能方面,國外桌面云服務(wù)商整體較國內(nèi)的服務(wù)商更加完善。
從下表中可以看出,深信服桌面云IOM智能運維引擎以監(jiān)控、分析、處置三者聯(lián)動為基礎(chǔ)設(shè)計思路,融合AI智能算法與專家規(guī)則,實現(xiàn)了VDI場景下全棧資源采集與分析。其智能探針在資源消耗極低的情況下,實現(xiàn)了虛機、主機、集群、硬件等多層級數(shù)據(jù)采集與調(diào)度分發(fā);在分析能力方面,IOM內(nèi)置了自更新的AI健康評分模型,卡慢診斷準確率高達90%,并基于歷史卡慢經(jīng)驗庫生成處置建議,形成監(jiān)控、分析、處置閉環(huán),達到降本增效的效果。
↑ 部分桌面云服務(wù)商智能運維能力對比
IOM:解決70%以上的桌面云運維管理問題
IOM(Intelligent Operations Management) 是深信服桌面云智能運維引擎,可以提供業(yè)界領(lǐng)先的桌面云性能診斷方案,即偵測、發(fā)現(xiàn)和解決70%以上的桌面云資源瓶頸問題。
系統(tǒng)結(jié)合機器學(xué)習(xí)算法和人工智能技術(shù),囊括了應(yīng)用、網(wǎng)絡(luò)、存儲、虛擬機、物理機等體系的運維解決方案,實現(xiàn)桌面云性能問題的快速排查,包括但不限于虛擬機卡頓、物理資源瓶頸、應(yīng)用異常、網(wǎng)絡(luò)中斷、木馬入侵等,7*24小時不間斷智能分析桌面云性能問題,提供全方位的優(yōu)化解決方案。
↑ IOM智能運維整體概覽圖
IOM核心AI能力詳解
為實現(xiàn)桌面云系統(tǒng)全棧的自動化監(jiān)控、分析與治理,深信服創(chuàng)新研究院鳳凰團隊聯(lián)合桌面云團隊從0開始,自研了AI自驅(qū)的桌面云運維管理引擎 IOM,其核心能力如下:
1.成本管理
(1) 閑置虛擬機識別。通過隨機森林分類模型,結(jié)合專家經(jīng)驗分析歷史虛擬機運行數(shù)據(jù),自動識別出閑置的虛擬機。回收閑置虛擬機,可大幅降低集群資源消耗,降低成本。
(2) 可減配虛擬機推薦。通過AI智能算法結(jié)合專家經(jīng)驗規(guī)則分析統(tǒng)計過去7天的歷史數(shù)據(jù),推薦出可以減配的虛擬機列表。合理配置虛擬機資源可以讓集群運行更流暢,減少不必要的管理開銷,資源利用更合理。
2.效能提升
(1) 全局體驗健康評分。基于Bagging策略的分段線性回歸算法對虛擬機、主機、集群運行狀態(tài)進行實時監(jiān)控并智能評分。根據(jù)智能評分可直觀了解到機器運行健康狀態(tài),并根據(jù)健康評分實施優(yōu)化和處置方案。
(2) 非法進程與惡意軟件識別。通過AI算法結(jié)合專家經(jīng)驗規(guī)則分析計算歷史軟件資源消耗數(shù)據(jù),識別出待優(yōu)化軟件的資源消耗并估算出優(yōu)化后的效果。當(dāng)系統(tǒng)資源不夠或出現(xiàn)卡慢時,及時處理非法與惡意軟件能帶來較大的體驗提升。
3.質(zhì)量改進
(1) 待擴容虛擬機推薦。智能推薦出待擴容的虛擬機列表。根據(jù)集群最佳體驗容量和主機負載情況,推薦待擴容虛擬機配置,解決虛機卡慢問題,提升用戶體驗。
(2) 虛擬機遷移方案推薦。通過AI智能算法分析計算歷史虛擬機潮汐數(shù)據(jù),自動地推薦遷移路線。根據(jù)推薦建議遷移相關(guān)虛擬機,可以更平穩(wěn)地使用集群資源,提升整體用戶體驗。
總體來說,IOM智能運維引擎,基于自研插件化采集探針、AI智能分析引擎等核心技術(shù)方案,實現(xiàn)了VDI場景下的成本管理、效能與質(zhì)量改進,為深信服桌面云全棧資源監(jiān)控、分析與診斷保駕護航。
以上就是本期《信服云黑板報》的分享,關(guān)注“深信服科技”公眾號,持續(xù)獲取更多技術(shù)干貨內(nèi)容哦!