近日,「七牛云 Niu Talk 」 數據科學系列論壇第三期如期舉行, 三位嘉賓圍繞大數據開發與開源生態,結合自己多年行業經驗,帶來關于「大數據開發與開源生態」的精彩演講和圓桌對話。
主持人 上海開源信息技術協會副秘書長 趙生宇
Zilliz 合伙人、首席布道師 顧鈞 分享
Zilliz 合伙人、首席布道師顧鈞在主題《 Unstructured Data Search Engine in AI Era 》分享中,暢聊非結構化數據服務。隨著技術的發展和人與人之間互動方式的改變,圖片、視頻、語音、文本等非結構化數據正在快速而持續的增長。智慧城市,短視頻,商品個性化推薦,視覺商品搜索等新興應用領域對非結構化數據分析與搜索提出了更高的要求。顧鈞結合 Zilliz 自研開源向量搜索引擎 Milvus 實踐經驗,分享如何幫助用戶構建高效的非結構化數據服務。
Databricks 開源技術負責人 范文臣 分享
技術的進步和新的解決方案,很多都與開源工具有很大關系,開源生態一直是技術人關注的熱點話題,Databricks 開源技術負責人,Spark 社區最活躍的貢獻者之一范文臣帶來分享《基于 Spark 的高性能查詢引擎》。
隨著 IO 硬件性能的不斷提升,越來越多的查詢引擎針對 CPU 進行優化。本次演講范文臣為大家分享了 Databricks 如何結合當前的硬件趨勢和公司的 Workload 趨勢,構建向量化查詢引擎 Photon,以及構建過程中的一些實踐經驗。這款查詢引擎,通過向量化、CPU 并行和指令集并行的方式獲得更好的性能。
圓桌討論
對于開源項目和商業化產品之間的關系,三位嘉賓貢獻了自己的想法,在矛盾與統一之間尋求平衡。對于開發者特別感興趣的基金會,深入了解 Linux 和 Apache 基金會的兩位嘉賓,對于開發者進行了回答,努力幫助更多開發者提供良好生態環境,為項目落地提供更多可能。同時面對中國開發者,基于開源生態和商業化的現狀進行了解讀,同時對于如何建設開源社區也分享了自己的想法。
隨著云計算跟大數據的深入人心,所有行業都在發生著或大或小的變化,數據中的商業價值也愈發突顯,「七牛云 Niu Talk 」數據科學論壇集結技術大咖,圍繞大數據價值、技術實踐,以及企業面臨數字化轉型所遇到的困難與挑戰進行了深入探討和分享。