5月14日,由阿里云、PAKDD 2021聯合舉辦的“第二屆阿里云智能運維算法大賽”首次以“線上+線下”同步舉行的方式圓滿落幕!本次大賽基于阿里云天池平臺舉辦,聚焦于“解決大規模生產系統中的內存故障預測”,尤其是內存故障引發的非預期宕機問題,得到了眾多高校學子的關注,吸引了超過1300支隊伍參賽。
2020年以來,全球經歷了新冠疫情的嚴峻考驗,各行各業對5G、大數據、人工智能等新一輪技術發展提出了更高、更新的要求,這一切都離不開作為技術底座的云計算基礎設施的穩定與創新,而基礎設施的智能運維發揮著保駕護航的重要作用,在持續提升穩定性,減排增效,加速產業升級等方面提供了不可或缺的關鍵驅動力。近十年來,工業和學術界都開展過關于內存故障預測的相關研究探索,然而對工業級大規模生產環境下的內存故障預測的研究卻很少。大規模生產環境業務錯綜復雜、數據噪聲大以及不確定因素多,因此,能否提前準確預測內存故障已經成為大規模數據中心和云計算時代工業界需要研究和解決的重要問題之一。
在此背景下,為了更好地利用數字化方式提升服務體驗,并與更多的優秀技術人員共同探討此類問題的解決思路與方案,第二屆阿里云智能運維算法大賽應運而生。
比賽自1月29日啟動以來,歷時三個半月,共吸引到1350支隊伍參賽。相比第一屆大賽,參賽隊伍增加,比賽也異常激烈。
復賽現場6支隊伍參加當下的線下總決賽,經過激烈的角逐,最終來自某數據挖掘俱樂部的“姬哀”隊獲得冠軍!同時,此次比賽也輸出了數十份來自國內外高校團隊貢獻的高質量解決方案,發表數十篇優秀論文,為數據中心內存類故障預測相關問題提供了他們的寶貴解決思路。
阿里云基礎設施負責人周明在現場致辭中表示,此次比賽搭建了一個鏈接阿里云基礎設施與行業、高校之間的產學研合作平臺,一方面通過產業實踐推動學界理論發展,另一方面通過學界理論研究和實踐研究來反哺產業界。未來,阿里云基礎設施也將通過持續舉辦競賽等多種形式構建智能運維產學研鏈條、橋梁和紐帶,探索新基建下的技術創新。
阿里云基礎設施智能運維負責人趙曉雪在主題演講中分享了團隊近幾年在智能運維領域的思考和探索,如堅持”線上化+數字化+智能化”的發展路徑和方針,希望通過打造數字智能的運維產品來解決云計算基礎設施規模化管理問題。
來自浙江大學的陳嶺主任和西安交通大學的王平輝教授也結合智能運維領域的理論研究、人才培養分享了精彩觀點。“智能運維正處于蓬勃發展階段,需要社會各界的廣泛參與和合作,這次比賽起到了很好的紐帶作用,不僅貢獻了前所未有的超大規模真實數據,而且產出了多個行之有效的領先方案,希望這個平臺能夠持續辦下去,推動智能運維產業更好發展。”
在比賽之后的圓桌討論中,周明還就“技術創新發展新形勢下對人才的要求和培養”同到場的嘉賓和同學們做了精彩的分享與交流,鼓勵同學們保持對技術、對世界的好奇心,提升思考深度。未來,阿里云基礎設施將持續進行技術探索,推動技術與實踐結合,通過類似平臺,建立與高校、學生之間的產學研鏈接,一起共創企業數字化轉型之路。
第二屆阿里云智能運維算法大賽圓滿落幕,但對生產系統中的內存故障預測,尤其是內存故障引發的非預期宕機問題等的討論和研究還遠遠沒有停止,相信通過天池這樣的開發者眾智平臺,能幫助學生更好地鏈接理論與實踐,在學校就能了解真實的業務場景是什么,實踐中的痛點和難點。未來,也期待有更多的同學,甚至更多的科技發燒友參與進來,大家一起貢獻智慧和力量,在這個平臺共同探討企業發展過程中最有挑戰的問題。