“眾研眾用”的群智協同創新正在重塑軟件產業的生態格局。4月25日,聚集產學研各界目光的第四屆數字中國建設峰會在福州開幕。作為本屆峰會的核心論壇之一,工信部、國家網信辦聯合主辦的軟件開源生態分論壇匯集部委領導、院士專家、開源機構、知名企業和開發者代表分享探討我國開源生態建設成果和未來發展路徑。
論壇現場,IEEE終身院士、湖南省政協原副主席蔡自興教授做了題為《發揮人工智能核心作用,促進開源生態繁榮發展》的演講,結合國家數字新型基礎設施建設背景,從國家人工智能宏觀發展戰略出發,闡述了開源軟件在人工智能行業的應用。開源中國CEO馬越則分享了心目中的未來開源社區藍圖,既要實現內容聚合,也要具備精準推送能力,還要讓志同道合的開源者實現更多互動。同時希望打造“拎包入住”的體驗,讓開發者把精力集中在產品上。
百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜在《開源開放促進科技創新與產業發展》主題演講中強調,開源深刻影響著AI技術研發和產業應用,AI開源發展正經歷三個變化,還分享了百度通過開源開放推動AI技術突破及產業智能化的實踐路徑。
(圖:百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜)
吳甜指出,開源開放是技術創新和產業發展的重要模式。過去一段時間里,人工智能在經歷快速實用化發展中被開源深刻影響著,隨著產業智能化的深入,AI開源項目越來越多企業參與和主導,從純AI技術架構發展到軟硬件協同對接,從AI本身發展到與大數據、云計算更一體化。
據介紹,目前全球軟件開源熱度持續攀升,自2016年至2020年,世界最大的開源代碼平臺GitHub上注冊企業數量逐年遞增。開源代碼廣泛覆蓋互聯網、物聯網、教育、網絡安全、營銷、金融、能源等各行各業。國內僅2020年一年開源項目數量便增長192%,是2013年至2018年開源項目的總和。在學術界,開源代碼已經成為AI領域論文成果的重要組成部分。在產業界,通過IDC的調研可以看到,86.2%的企業或開發者在日常工作中都選擇使用開源深度學習框架。
百度積極參與開源開放,基于多年產業實踐經驗打造的自主可控的深度學習開源開放平臺飛槳,包含深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件,是人工智能技術研發的根基。飛槳的開源開放既加速了技術突破,也降低了產業AI開發與應用門檻。
例如,以飛槳為底座的知識增強語義理解技術文心ERNIE不斷刷新自然語言理解任務效果,并在多語言、跨模態語義理解等方面不斷突破。同時飛槳也在支撐“螺旋槳”生物計算平臺,致力于支持AI+生物計算的前沿探索。
吳甜還在論壇現場介紹了飛槳最新的技術進展,分布式訓練技術業內首創4D混合并行策略,通過數據并行、模型并行、流水線并行和分組參數切片四項策略組合,可訓練千億級稠密參數模型,且訓練速度遠高于3D混合并行策略。4D混合并行策略結合了多種并行策略的優點,將分布式訓練技術與業務緊密結合,幫助開發者更好地應對大規模產業應用中對分布式訓練的需求。
目前飛槳在GitHub上獲得Star總數約7萬,多個項目登頂GitHub Trending(當前熱門趨勢),成為最受全球開發者歡迎的項目,開發者和企業使用飛槳可以更快速、便捷地開發AI應用。目前飛槳已經凝聚了265萬開發者,服務超過10萬家企業,覆蓋農業、工業、林業、民生、通信、電力、公益、城市管理等數十個行業,創造了超過34萬個模型。
百度同樣重視開源生態建設,不僅是APACHE軟件基金會、LINUX Foundation和云原生計算基金會的金牌會員,還是開放原子基金的創始會員與理事單位,在國內外的開源組織中享有聲譽。同時百度持續投入人才培養,截至2020年底已培養超過100萬AI人才,未來5年還將培養500萬AI人才。
飛槳等人工智能開源開放平臺為產業創新和生態繁榮提供了源動力,讓技術發展更快、應用普及更快。未來,百度也將繼續擁抱開源,推動越來越多的行業加入產業智能化升級的浪潮中。
來源:網易號