2020年8月15日,由清華大學、中國計算機協(xié)會、運營商主辦的第三屆國際智能運維(AIOps)挑戰(zhàn)賽決賽暨AIOps研討會在杭州再度火熱開啟。541名選手組成的141支隊伍經過長達5個月的激烈角逐,6支隊伍成功闖進決賽。在決賽答辯中,紫光股份旗下新華三集團參賽團隊H3C AI Institute隊贏得多位評委及業(yè)務專家認可,最終榮獲冠軍。
本屆挑戰(zhàn)賽以當前運維領域的熱點“微服務應用系統(tǒng)故障發(fā)現和根因定位”為賽題,所用數據全部來自運營商真實業(yè)務環(huán)境,由運營商在準生產環(huán)境中進行數據采集、清洗、流量縮放、故障注入和實時數據推送,最終提供業(yè)務指標、微服務調用鏈、基礎設施性能指標、部署架構共4大類合計240小類數據,為參賽選手創(chuàng)造了完全真實的運維環(huán)境。
新華三集團選手張闖講解技術方案
面對復雜的課題環(huán)境,新華三集團代表參賽隊伍H3C AI Institute從實際應用出發(fā),采取模型泛化預測與創(chuàng)新算法,對應多組系統(tǒng)指標,在原始數據集處理過程中大幅提升效能,另一方面,通過構造異常評分表,實現故障根因的快速識別,大大降低了對算力資源的占用。基于此,新華三集團代表隊在故障排查準確度、性能效率等多個關鍵指標上都實現了領先,最終以顯著優(yōu)勢贏得冠軍。
賽后,作為大賽冠軍代表隊隊長,新華三集團AI研究院敖襄橋院長受邀就“AIOps最后一公里”議題進行分享:當前智能運維的普遍問題——算法推測故障的準確率不高,加之不同企業(yè)之間IT架構業(yè)務的差異性,這就使得用戶在AIOps落地中不得不面臨準確性和性能做權衡的處境。因此,我們需要不斷創(chuàng)新并優(yōu)化機器學習算法,梳理自動化預案和執(zhí)行手段,借助場景化驅動前沿AIOps 算法落地,進而提高故障分析、定位和排查的效率。
新華三集團AI研究院敖襄橋院長參與論壇發(fā)言
隨著AI技術的進一步發(fā)展與落地實踐,人工智能將進一步與IT運維緊密結合,助力企業(yè)迎戰(zhàn)復雜的業(yè)務系統(tǒng)。對此,新華三集團將繼續(xù)踐行“AI in ALL”智能戰(zhàn)略,用AI技術提升IT運維的風險控制能力和服務效率,推進運維自動化、智能化演進,護航百行百業(yè)的數字化轉型。