“開源(open source)”這個詞,指軟件源代碼被開放出來,其他用戶可以在其基礎上修改和學習。開源既造就了繁榮的互聯網時代,又成為技術理想主義者的“烏托邦”。在開源的江湖,珠玉在前,后繼四起,但百度從未缺席。
近日,權威科技媒體通過分析GitHub上的開源項目數據集GitHubArchive,得出2020和2019年度全球深度學習框架排名榜單,其中,百度飛槳PaddlePaddle均力壓谷歌TensorFlow,緊隨Facebook PyTorch之后,其搶眼的數據表現意味著在開發者積極貢獻代碼和項目、社區活躍、代碼迭代速度上一直保持著強勁的競爭力,已經成為了國內第一、世界第二的深度學習開源框架,將國內開源的“終極理想”往前又推進了一步。
2020/2019年度全球開源深度學習框架活躍度排名榜單
如果GitHub開發者想要對開源項目貢獻代碼,需發起pull request把自己修改的代碼合入分支主,如果pull request被合入,則表示代碼被采用,成功完成一次開源貢獻。因此,pull request的發起(open)數量是評估開發者積極貢獻代碼、項目和社區活躍最直觀的指標,合入(merged)pull request是評估開源項目的代碼迭代速度的一個極佳的權威性指標。
該媒體通過分析GitHub開源項目數據集GitHubArchive之中關于pull request的發起和合入數據,獲得了2020和2019年度全球深度學習框架活躍度排名榜單,其中,百度飛槳的open數據由去年的2759次躍升到今年同期的3391次,比現階段暫列第三的谷歌Tensorflow高出1000多次。飛槳的 merged數據由1924次躍升為2428次,力壓暫居第一Pytorch的238次,比第三名Tensorflow高出近1000次,這也意味著“動靜統一、軟硬融合”的飛槳一直在致力于讓深度學習技術的創新與應用更簡單,其提供的AI底層技術也深受開發者歡迎。
GitHub 標星 47000+ 百度飛槳成為國產開源“流量擔當”
百度飛槳于2016年9月正式宣布開源,這使得百度成為繼谷歌、Facebook、IBM后第四家將AI技術開源的公司。作為國內AI開源的扛把子,百度飛槳集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件于一體,并根據本土化特點將開源框架與應用層面做了更好的結合,旨在打造自主可控的人工智能操作系統,持續賦能廣大開發者,這意味著個人開發者也可以利用飛槳提供的平臺部署自己的深度學習模型。
經過 4 年的發展,飛槳在 GitHub 上已經有 62 個 Repositories,共收獲 47000+ Star,成為國產開源項目的佼佼者。
(飛槳在 GitHub收獲了超過47000個Star)
作為我國首個開源開放、功能完備的產業級深度學習平臺,飛槳能夠做到這樣的地位,當然少不了要有自己獨特的優勢??偟膩碚f,飛槳有以下 4 大領先技術。
首先,同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率。飛槳平臺結合了動態圖的易用性和靜態圖的高性能,使開發者可以兼顧兩者的優勢。第二,針對大規模的工業化場景,飛槳提供大規模分布式訓練能力,在真正的工業場景應對自如。飛槳平臺推出了支持萬億規模參數模型的實時更新能力和訓練能力。第三,端到端的部署是應用深度學習的一個非常關鍵的環節,飛槳提供非常完備的支持各種硬件的端到端的部署能力,能夠使得開發者推理、預測的過程足夠順暢。最后,飛槳還有大量在產業實踐當中沉淀出來的模型,并提供官方的支持,能夠保證開發者的應用效果是最佳的、真正可靠的。
更可貴的是,飛槳并沒有滿足當下國內深度學習領域“流量擔當”地位,仍在持續進行優化升級。在前段時間舉辦的百度世界2020百度大腦分論壇上,飛槳實現了"動靜統一、軟硬融合"的更新:硬件上,飛槳目前已適配22種芯片型號,覆蓋15家硬件廠商,對國產硬件的支持超過TensorFlow和PyTorch;軟件上,動態圖功能升級實現了動靜態的結合,讓用戶更容易開發模型;全面升級的API體系,則對于開發者更加友好。
2020年9月,百度飛槳深度學習平臺入選了2020服貿會 “科技創新服務示范案例”, 數據顯示,飛槳當前支持140+個產業及開源算法,累計開發者230萬,服務企業9萬家,基于飛槳開源深度學習平臺產生了31萬個模型。在城市、工業、電力、通信等很多關乎國計民生的領域都有飛槳在發揮作用。
踐行開源開放理念 百度飛槳在多領域助力應用落地
基于其簡潔、靈活、快速的特性,百度飛槳推動了各個行業的深度學習應用,在液晶顯示屏的檢測、機器人安全巡檢、遙感監測等領域發揮著不可代替的作用。拿液晶顯示屏檢測來說,精測電子應用飛槳開源深度學習框架開發后,基于其分類、檢測、分割等多種功能模塊,對具有缺陷的液晶屏幕檢測的精度上有很大提升。
(百度飛槳全景圖)
同時,飛槳還正在利用技術優勢推動各個行業的深度學習應用,在液晶顯示屏的檢測、機器人安全巡檢、遙感監測等領域發揮著不可代替的作用。
例如在消費類電子領域,OPPO在其多個業務線都上線了基于飛槳構建的大規模分布式推薦系統,覆蓋全球3.5億月活用戶;工業安全領域,通過飛槳研發的輸電線路通道隱患目標圖像與視頻智能檢測系統,實現了輸電線路通道隱患目標的自動化識別和預警;環境保護領域,飛槳支撐的無人機自主飛行+應用管理平臺,可以對森林進行自主巡邏、火情監測、非法入侵、森林樹木砍伐監測等功能……而這些只是百度飛槳深度學習平臺產業實踐的冰山一角。
(電網智能巡檢方案上線以來已發現多起安全隱患,是飛槳的典型應用之一)
今年5月,百度發布了Paddle Quantum,這是建立在百度飛槳深度學習平臺之上的開放源代碼的機器學習工具包,它包括量子開發工具集,量子化學庫以及一系列優化工具,可以幫助領域內的科研人員以及開發者在量子計算應用程序中訓練和開發AI,也為相關領域的愛好者開發量子人工智能的應用提供了強有力的支撐。
在百度開源理念下,多領域的領先技術被開放出來,越來越多的開發者通過開源技術來構建業務,并且形成了應用繁榮、活力十足的社群。尤其是飛槳深度學習平臺,既幫助開發者實現人工智能應用的落地,也在不斷的反饋中迭代平臺架構,促進自身技術升級,并更加貼合開發者的實際需求。
例如,有大學生借助飛槳,讓人工智能來為野外攝像裝置拍攝的海量圖片進行篩選和標注,代替人工的繁瑣和低效,大幅節約人力成本。這一產品將在今年年底交付,方便野保工作者輕松使用,為滇南地區包括滇金絲猴在內的生物多樣性保護貢獻了很大力量。
還有大學生借助飛槳來搭建深度學習模型,通過攝像頭捕捉和識別聾啞人群的手語,再轉化成語音。如此一來,人們可以流暢地與聾啞人交流,改善特殊人群的生存處境。該項目已在AI Studio人工智能學習與實訓社區開源,以群策群力實現優化和落地。
在這些案例中,開源的飛槳成為鏈接開發者之間的“橋梁”,不僅讓每一個人可以實現自己的理想,更可以通過這些公開項目,加速技術的演進與商業、社會議題的解決。社區的廣泛參與,正是飛槳等開源項目的活力體現,在其上構建繁榮的生態,形成足夠強大的產品競爭力。
構建開源開放生態 百度要打造人人可以實現理想的技術烏托邦
開源思路,既體現了百度的基因和能力,也表達出其開放的態度,助力更多企業和開發者實現自己的應用落地與業務升級轉型。
以深度學習框架為例,百度飛槳具備了深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件,讓所有人都可以在平臺上部署自己的深度學習模型,并且具備簡潔、靈活、快速的特性。
(飛槳深度學習開源開放平臺全景圖)
另一個典型的領域是自動駕駛。2017年11月,百度發布了全球首個自動駕駛開源項目——Apollo 自動駕駛開放平臺,其自動駕駛軟件可供任何人免費下載及修改使用。這意味著,許多企業都能通過Apollo平臺結合車輛和硬件系統,快速搭建一套屬于自己的完整的自動駕駛系統。
目前,百度 Apollo 平臺已經匯聚了全球177家生態合作伙伴;在全球,有97個國家超過3.6萬名開發者使用 Apollo 開源代碼,開源代碼數量超過56萬,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。
(Apollo已經形成全球最強的自動駕駛生態)
此外,還有百度ECharts,這是當前流行、最強大的可視化庫之一,它提供了直觀,生動,可交互,可個性化定制的數據可視化圖表。從2013年1.0版本發布至今,為用戶提供了交互、多維度數據分析、數據自由刷選、多圖表聯動、渲染等豐富功能。目前,Apache ECharts (incubating) 在Github中的star數已經超過42k,每周npm下載量超過25萬。
目前,百度已經構建起了全新的開源開放生態,主導了一千多個開源項目,聚攏了超過一萬名社區貢獻者,獲得超過30萬次GitHub Star(點贊或支持)。從人工智能基礎底座深度學習平臺,到語音、視覺、自然語言處理、知識圖譜等通用AI能力,再到Apollo、DuerOS、智能小程序等開放平臺,以及智能交通、智能家居、工業農業等場景化應用,百度開源的能力與技術已經在生活中廣泛落地。
(百度開源開放生態)
除此之外,百度還深度參與國內外頂級開源基金會和組織。百度既是Apache 基金會、Linux 基金會以及云原生計算基金會的金牌會員,其旗下Echarts、Doris、Brpc等多個項目已經成為 Apache 基金會孵化項目,Baetyl、IME、EDL等項目入選了Linux,百度BFE更是成為云原生計算基金會中,第一個來自中國的網絡方向沙箱項目。
同時,百度也在大力支持中國自主代碼托管平臺建設,以應對復雜國際形勢下帶來的封閉風險。2019年,百度戰略投資了開源中國,這是中國最大的開源技術社區,旗下運營的Gitee代碼托管平臺是全球僅次于GitHub的代碼托管平臺,每日約增加5000名開發者、200家企業客戶、1.7萬代碼倉庫。在國際市場,開源中國已經可以和GitHub掰手腕,為中國開發者提供了自主穩定的保障。
百度創始人、董事長兼CEO李彥宏在百度世界2020大會上表示,“推動人工智能扎實滲透,行業要充分利用開源、開放平臺,它在人工智能發展當中的作用會越來越受到重視。”百度CTO王海峰也認為,“一方面,開源創新可以加速技術的創新發展,不斷拓展人類認知邊界和技術邊界;另一方面,所有開發者都可以基于開源開放的成果開發自己的項目、產品及業務,更便捷、高效、安全地推進技術創新與應用。”
(百度CTO王海峰在2020中關村論壇闡述AI開源開放價值)
可見,“開源”兩個字已經深植百度的基因之中。也證明了,開源開放才是實現技術革新與產業演進的最佳途徑。未來也需要更多像百度一樣的企業,致力于開源開放,為企業、行業和廣大開發者,打造共同繁榮的技術烏托邦。