摘要:實至名歸,亞馬遜云科技DGL 榮獲2021 OSCAR尖峰案例開源項目和開源社區獎!
2021 年 9 月 17 日,在中國信息通信研究院主辦的“ 2021 開源產業大會"上,亞馬遜云科技 DGL 榮獲“2021OSCAR開源尖峰案例”——開源社區及開源項目領域獎項,彰顯亞馬遜云科技技術實力與開源貢獻。
在每年的開源產業大會上,中國信息通信研究院都會隆重宣布“OSCAR開源尖峰案例”獎項,旨在樹立開源典范,更好地推動開源技術在中國市場的落地。 2021 年,該獎項分“開源人物”、“開源社區及開源項目”、“開源企業—開源運營與生態建設”、“開源企業—開源治理”、“開源創新(二次開發)”等五大領域。而在“開源社區及開源項目”領域中,通過云計算標準和開源推進委員會成員對來自眾多知名企業的 170 多個優秀項目的層層評選,亞馬遜云科技 DGL 在激烈的競爭中脫穎而出,成功榮獲國家級認證認可,贏得獎項。
DGL(Deep Graph Library)是一款面向圖結構數據的專用深度學習框架。于 2018 年 12 月在Neurips大會上宣布開源。開發團隊最初主要來自NYU和NYU Shanghai,現由張崢教授帶領的亞馬遜云科技上海人工智能研究院主要開發,項目上線初就獲得廣泛關注和好評。
DGL是一項具有深遠意義的開源項目,它易用性強,采用以“圖”為核心的編程抽象,天然接近圖算法的語義;具有高性能,使用算子融合等技術,相比同類系統能提速 10 倍甚至幾十倍。借此,企業可以面向復雜的業務場景,提高語音分析、文字分析、時間序列分析等常規工作的效率和精準性;多平臺支持,支持多款深度學習框架(PyTorch, MXNet, TensorFlow),用戶可以基于此進行大規模圖神經網絡訓練;海量巨圖支持,支持多機多卡分布式訓練,可以對十億點規模的圖做訓練。DGL希望幫助開發者將圖神經網絡落地到具體的業務場景中,改善業務模式,創造更多價值。
與其同時DGL在學術圈具有廣泛的影響力,基于DGL發表的學術論文有近 400 篇,包括圖靈獎獲得者Yann Lecun在內的諸多知名學者對項目給予高度評價。DGL在幾乎所有數據挖掘頂級會議上(KDD,WWW,WSDM等)做過專場實操教學。僅僅在兩年時間內,來自學界和業界外部項目貢獻者已經增長至 140 多位。此外,基于DGL的軟件生態也初具雛形,衍生出面向分子生物,知識圖譜,自然語言處理,推薦系統等多款專用AI工具包。
DGL開源后,在項目維護和社區建設方面也面臨著一些挑戰并采取積極應對:
挑戰一:圖深度學習是一個全新的,快速演變的領域。
DGL團隊一直積極收集開源社區的反饋,進行有效的向后迭代。并結合最新的科研成果,進行快速向前迭代。
挑戰二:由于圖結構數據的普適性,其應用分布非常廣泛,領域性很強。
團隊在社區運營上設置階梯化的文檔和教程,培養領域開發者。保持和學界、業界的溝通,從而建立共贏生態。
文檔建設方面獨創“文檔漢諾塔”的管理方式
也正是項目的這些技術亮點和社區運營的優勢使得DGL被信通院評為2021OSCAR開源尖峰案例的開源社區及開源項目。
未來,亞馬遜云科技將持續創新,貢獻更多的優秀開源項目同時更好的支持開源并與云計算技術進行集成與融合,將加速以開源為基礎的機器學習、人工智能等眾多領域技術在生產實踐中的應用,為全球用戶及企業提供更加成熟的成長契機。