近年來,5G、云和人工智能正加速智能社會的到來,三大技術正在重構網絡。網絡作為行業(yè)數字化的基礎平臺,是每個企業(yè)數字化轉型的底座。隨著網絡基礎設施的升級,帶來更高的網絡帶寬和更低的網絡時延,網絡業(yè)務質量高要求的同時帶來網絡復雜度的增加,網絡的日常保障和運維工作變得更加挑戰(zhàn),運維能力的演進成為電信網絡能否持續(xù)發(fā)揮效能的關鍵因素。
傳統(tǒng)人工、工具化運維已不能滿足當前網絡的運維需求,數據統(tǒng)計顯示,通信網絡運維問題大部分時候都是被動發(fā)現,是由用戶的投訴感知,運營商本身非常缺乏預防性的網絡監(jiān)測和維護手段。同時,網絡故障根因定位更難,日常運維有90%時間都花在問題定位方面。網絡的智能化運維轉型已經成為很多運營商的迫切需要。
但是,智能化在網絡運維業(yè)務的工程化落地過程中,面臨諸多挑戰(zhàn):首先,運營商網絡、數據中心、企業(yè)園區(qū)等網絡復雜,千差萬別,需要業(yè)務分析師、AI算法開發(fā)工程師等人員參與,對相關人員的投入和技能知識要求較高;另外,針對開發(fā)不同場景的AI應用,數據建模和模型調測等工作耗時耗力,整個應用開發(fā)周期很長。為解決這些問題,構建和應用AIOps平臺能力,已經成為電信行業(yè)運維智能化演進的趨勢和主要方向。
在4月13日華為HAS2021 NAIE圓桌會議上,NAIE產品部首席技術官程磊跟業(yè)界分析師介紹了華為NAIE AIOps服務的規(guī)劃和最新發(fā)展,以及在一些項目中的應用實踐情況。
華為NAIE產品部首席技術官 程磊
華為NAIE從2019年開始正式對外發(fā)布,同時開始構筑AIOps的平臺能力和服務。從2020年開始,陸續(xù)發(fā)布三批AIOps AI原子能力,編排框架和一些典型場景的智能應用,目前已經具備立體化的AIOps能力,基本滿足網絡運維大部分場景的智能化應用需求。
豐富的AI原子能力
NAIE AIOps服務當前能夠提供超過20種AI原子能力,覆蓋網絡運維業(yè)務的全流程,包括故障預測、故障檢測、根因診斷等。原子能力庫支持常見運維業(yè)務場景需求,如流量預測、KPI異常檢測、日志異常檢測、CHR異常檢測、異常關聯分析、事件聚合、根因定位等。
同時,基于華為具備深厚的電信網絡知識沉淀,結合高質量的訓練樣本,以及最佳算法調測和實踐, 這些AI原子能力模型在保證高精度高同時,具有良好的模型泛化能力。以異常監(jiān)測為例,這些檢測大多都是針對通用時序數據,與業(yè)務松耦合,在使用時只需配置少量業(yè)務屬性,如檢測方向、周期或非周期等,算法可自動識別KPI特征,匹配最優(yōu)算法,精準識別異常點。
另外,華為NAIE AIOps服務在沉淀核心AI資產自主研發(fā)的同時,對生態(tài)合作也持開放態(tài)度,支持使用者根據實際業(yè)務需求開展算法模型的創(chuàng)新與開發(fā),自行擴展AIOps能力。
靈活的組合編排與DevOps能力
編排操作簡單靈活,使用者可選擇業(yè)務場景所需的AIOps原子能力,通過可視化方式完成流程串接,只需從組件庫中拖拽數據及原子能力進行組合,即可完成應用場景端到端的圖形化編排。并且,支持進行業(yè)務泛化的參數配置,包括數據接入方式、模型參數、內置電信領域泛化參數,真正支撐使用者零編碼、低門檻進行作業(yè),實現高效地構建AI應用。
同時,NAIE AIOps的編排框架還提供數據可視化服務,支持輕松按需搭建可視化大屏,其包括豐富的2D/3D可視化組件,如圖表控件、地圖控件、交互控件以及媒體控件等,拖拽式自由布局,快速實現DIY可視化大屏,一鍵預覽,業(yè)務結果快速呈現,實現運維應用效果的實時可視。
另外,編排框架還集成RPA功能,只需極簡的配置,即可實現數據采集和結果推送等操作,打通業(yè)務應用中的流程斷點。
典型場景的AIOps APP、開箱即用
NAIE AIOps服務目前針對運維最常見的業(yè)務場景,提供10+開箱即用的APP,覆蓋運營商網絡、園區(qū)網絡、DC網絡、IT應用四大領域:
?運營商網絡,提供跨域故障識別分析、核心網日志異常監(jiān)測、基站流量預測、無線性能分析等;
?園區(qū)網絡,提供園區(qū)5G設備故障監(jiān)測、園區(qū)網絡智能巡檢、光模塊故障預測等;
?DC領域,提供硬盤故障預測、DC PUE優(yōu)化、供電鋰電故障預測、DC安全智能巡檢等,
?IT應用領域,提供IT應用健康監(jiān)控、云服務日志異常監(jiān)測等
這些應用都可以快速地實現部署和應用,同時可以提供云上或地端靈活的部署方式選擇。
此次分析師大會,程磊還介紹了華為NAIE AIOps的應用實踐情況,經過一年多的發(fā)展,NAIE AIOps逐漸開始進入規(guī)模應用階段,服務已經應用于無線接入、數據通信核心網、DC等6個運維領域,應用局點超過30個,服務月調用次數已經超過4.1億次。而且應用的效果和價值明顯, 某地運營商基于NAIE AIOps服務實現的智能運維系統(tǒng),在7個月應用期間,共計發(fā)現52個異常,異常指標查準率85.80%。而且多次提前發(fā)現網故障并提前預警,讓運維人員及時處置,成功避免大規(guī)模的客戶業(yè)務影響。
AIOps作為華為網絡智能引擎的核心能力,華為在未來會繼續(xù)加強投入,程磊表示,“華為NAIE AIOps服務是電信知識經驗和算法能力的深度結合,運營商的運維轉型和智能化是大勢所趨,我們致力于打造優(yōu)質的AIOps平臺服務,沉淀AIOps場景最佳實踐,助力運營商高效地實現智能運維。”