汪源:解決“卡脖子”問題,開源更容易成功
開源對于生態對接的重要性是什么?
開源生態建設對于To B客戶的意義在哪里?
開源是否是實現國產化替代的合適路徑?
近日,網易副總裁、杭州研究院執行院長、網易數帆總經理汪源受邀參加阿里云“大咖說*對話開源”,與阿里云數據庫開源戰役負責人、阿里云智能數據庫產品事業部架構組負責人曲山(黃貴)展開精彩對話,以Data Infra(數據基礎設施)為例,就開源生態、商業化及國產化等一系列問題進行了深入探討。
Curve 開源存儲,意在全場景支持
汪源是資深的開源技術實踐者,2006年,初到網易的他面對業務增長帶來的挑戰,采用分庫分表的方案推進開源MySQL對Oracle的替代。這比后來影響巨大的“去IOE”行動還要早,而這套技術現在依然運行良好。
汪源介紹,網易開源之路可以分為用好開源、增強回饋、自主開源這三步,即首先充分利用開源技術發揮價值,而后將對其不完善之處的增強貢獻給社區,最后是將自研項目開源,解決已有技術架構力不能及的問題。
開源云原生軟件定義存儲系統Curve就是第三步的產出,是網易數帆突破開源存儲性能瓶頸的努力,也是網易數帆和阿里云在數據庫領域合作,為開源PolarDB for PostgreSQL提供分布式共享存儲的主角。曲山表示,穩定性、可靠性和可用性這些是存儲的基本需求,數據庫業務有更高的要求,如對一寫多讀的架構,要支持多點掛載、閃回查詢等能力,PolarDB for PostgreSQL和Curve 完成了對接。
Curve的目標,是打造一個高性能、易運維、全場景支持的通用存儲系統,包括支持PostgreSQL、MySQL等多種云原生數據庫,包括在塊存儲之外還提供文件存儲,汪源認為,這將使得整個技術棧能夠發揮更好的效益。
開源是基礎軟件成功的必要條件
在目前的基礎軟件領域,尤其是Data Infra,開源越來越流行,汪源認為,開源是成功的必要條件,以Curve為例,要想和Ceph分庭抗禮,不開源是不行的。
曲山同樣認為,開源是打造行業標桿產品的必選項。曲山表示,商業產品獲得客戶需要付出比較高昂的成本,只有做到開放才能跟各種生態去對接。
曲山解釋說,開源軟件采用開放的標準的接口,對于打通生態實現基礎軟件構架體系一體化很重要,如PolarDB和Curve等開源軟件的對接都是基于標準的接口,在實踐中并不需要耗費很多精力。
To B技術需要通盤考慮技術生態位
網易數帆的開源實踐,始于服務網易業務,星辰大海卻在To B市場,通過網易數帆為更多客戶提供服務。汪源表示,這需要每一項技術通盤考慮能否與上下游構成一個健康的技術生態鏈,動態地發展,不斷提升和改進,每一層都有多重技術選項和多個服務商來提供產品,最后組成一個很好的解決方案給客戶。
良好的技術生態意味著要有一個繁榮的社區,有不同行業和企業的貢獻者,而不是只有一家公司唱獨角戲,從而為企業有效分散供應鏈的風險。
那么,軟件開源了,是否影響商業化的推進?汪源和曲山都認為,如數據庫這樣的復雜的基礎軟件產品,真正在工業級場景下大規模應用,企業是需要專業團隊來提供技術保障的。
汪源表示,專心做好產品,把客戶基礎做得足夠大,生意自然能做大,“不用著急,至少在你的開源項目沒有達到一定的狀態之前,不用過早地去關注這個事情。”
曲山表示,通過云服務把已經驗證過的產品開放出去,也是一條較好的商業化途徑,如Databricks、Snowflake就是典型的例子。
解決卡脖子問題,開源比閉源成長更好
在今天基礎軟件國產化替代、解決卡脖子問題的趨勢下,開源模式獲得了空前的關注,但開源真的比傳統的閉源研發模式更有優勢嗎?
在2003年就參與研發國產數據庫神舟OSCAR的汪源對此深有感觸。他表示,神舟OSCAR當年在科技部測評中得分遠超第二名,但到今天看來發展得不甚理想。雖然國內的開源數據庫和Spark、Snowflake等Data Infra技術相比體量仍然差距巨大,也不能說特別成功,但對比非開源國產數據庫和現在開源的國產數據庫最初三五年的發展,汪源認為開源更勝一籌。
“還是能夠明顯地看出來,開源數據庫至少前期的成長過程,比原來非開源的(數據庫)要高很多,用開源的方式去做,成功的概率會更大。”汪源說。