文丨劉雨琦
馬云曾說,數據是當下“最貴”的資產,若阿里巴巴不搞云計算,可能就會死掉。而數據庫作為整個數據行業的基礎軟件,正在迎來它的春天。
國產數據庫的接連上市,為信創風口下的獨立數據庫廠商,注入了新的生命力。
6月29日,武漢達夢數據庫股份有限公司(簡稱“達夢”)遞交招股書,準備在科創板上市。此次IPO,達夢數據計劃募資23.51億元。一旦成功上市,達夢數據將成為國產數據庫“四朵金花”中的第一股。
無獨有偶,6月21日,星環科技通過上市委會議,擬發行股票數量不超過3021萬股,合計募集19.61億元,資金將用于大數據與云基礎平臺建設項目、分布式關系型數據庫建設項目、數據開發與智能分析工具軟件研發項目等。
達夢與星環科技或許正是在信創風口下,獨立數據庫廠商發展10年-20年現狀的一個縮影。
達夢招股書顯示,2019-2021年度,營業總收入分別為3.01億元、4.5億元和7.43億元,最近三年營業收入復合增長率達到57.07%,營業收入增長的同時,歸母凈利潤也在穩步增長,報告期內歸母凈利潤分別為:0.89億元、1.49億元和4.43億元。
值得注意的是,達夢三年平均凈利率高達40.7%,已經可以堪稱“暴利”。
相比之下,星環科技的業績則沒那么好看。星環招股書顯示,2019-2021年度,營業收入分別為1.74億元、2.59億元和3.3億元,最近三年的營業收入復合增長率達到37.8%。不過,雖然營業收入在穩步增長,但由于成本和費用高居不下,導致其近三年內持續虧損,2019-2021年歸母凈利潤分別為-2.11億元、-1.84億元和-2.46億元,凈虧損率分別高達143%、71%和74.5%。
從經營狀況來看,作為最早一批的傳統數據庫產品,在經歷了近20年的產品打磨和技術研發后,達夢正在邁向規模化發展和盈利的道路,而星環從2013年正式成立至今的近10年時間,對于數據庫的行業周期來說仍處于早期階段,處于持續虧損狀態。
可見,數據庫利潤率雖然超高,卻是個需要超長的投入周期的生意。星環和達夢經營狀況的差異,也正是數據庫廠商早期和中期情況的寫照。
數據庫作為智能時代的基礎設施之一,國產替代需求正在爆發。這兩家傳統數據庫公司能得以上市,最主要還是受益于信創風口下,黨政客戶和八大行業的需求轉變。
短短一個月內,兩家國產數據庫廠商接連申請上市,透露出中國數據庫發展到了一個新的階段。前期通過信創風口服務政企客戶已經渡過了產品的初步打磨的艱難時期,在經歷了高速成長期之后,國產數據庫將進入商業化和市場化的階段,通過生態和合作伙伴的力量,以加速縮短國內外頭部公司的差距。
“新老玩家”現狀
從整個信息技術產業技術棧層次來看,信息系統主要由基礎硬件、基礎軟件和應用軟件等部分組成,其中以操作系統、數據庫、分布式系統、中間件、編譯器等為代表的基礎軟件在信息系統中承擔基礎性作用。
從市場的角度看,整個大環境令數據庫的自主可控成為大趨勢。據不完全的數據統計,目前國產數據庫廠商有200多家。這些廠商大致分為四大類:
第一類,云廠商。如:騰訊云,阿里云,華為云等云廠商下場做數據庫。占據云生態優勢,目前國內全棧的云廠商,使其在軟硬件協同方面有機會做一步優化,實現數據庫整體性能的提升;
第二類,傳統數據庫。如:南大通用,達夢,金倉、漢高、優選等。這類企業的商業模式更多是license(授權許可)模式和軟件售賣模式。這類主要為信創數據庫公司,占據黨政軍背景及政策優勢;
第三類,新興數據庫廠商。新興數據庫廠商:巨杉大數據、PingCAP、偶數科技、星環科技等;其中,新興廠商主要是最新一代的面向云原生架構的數據庫,架構優勢更為明顯。
第四類,換道廠商。一類企業如:恩墨、海量等,他們從做服務轉到做數據庫。還有一類企業如亞信和中興,他們之前從某一行業內做行業應用,換到了數據庫的賽道,利用原有客戶及業務基礎,疊加銷售。
達夢是傳統廠商的代表,而星環則是初創廠商中首個沖刺IPO的企業。規模和階段的不同,也是二者產生了如此大的利潤差異的主要原因。相比于達夢,星環處于數據庫企業發展的早期,在研發、銷售和管理方面的持續投入比較大,星環招股書內預計在未來一段時間內,虧損可能會持續擴大。
同時,對比二者的收入規模,達夢是星環的一倍之多。星環由于營收規模較小,并沒有形成規模化效應覆蓋成本和投入,而達夢在2015年左右,便達到了基本的收支平衡,并開始陸續研發包括圖數據庫在內的新產品。
不止是市場定位和規模的不同,以數據庫的應用類型來區分,達夢是傳統OLTP(交易型數據庫)的龍頭之一,主要面對黨政軍等政企業務數據相關性強的事務場景,涉及高并發數據的“增、刪、改、查”;而星環科技的主要場景則是OLAP(分析型數據庫),圍繞數據的集成、存儲、治理、建模、 分析、挖掘和流通等數據全生命周期提供基礎軟件及服務。
達夢招股書顯示,其主要產品是數據庫管理系統、數據庫集群軟件,以及衍生出的云計算和大數據平臺。近幾年,隨著數據庫的應用不斷深入,又衍生出了數據及行業解決方案和運維服務。
圖源達夢招股書
其中,軟件產品使用權是其主要的收入來源。2019-2021年度分別為2.08億人民幣、占比69.32%;3.69億元、占比82.42%;6.42億元、占比86.57%。
軟件產品中,達夢數據庫管理系統(DM)是核心,其是大型通用的關系型數據庫的,特點在于核心代碼為100%自主研發,不依賴開源數據庫,安全級別與自主可控性能較高。對外連接大型企業的ERP、財務大集中等大規模信息系統,保障數據的可用性和安全性。
在此基礎上,若企業利用兩臺或多臺數據庫服務器來共同構成一個邏輯上的數據庫,數據庫集群軟件可通過系統“拼接”的方式,提供多種類的數據庫集群形態。同時,隨著企業前臺對數據應用的需求激增,達夢也推出了云化大數據解決方案,包括云資源動態調度、云數據庫服務等數據PaaS管理平臺。
而星環則是通過數據庫打造了企業的數據中臺,為企業提供多款大數據基礎軟件產品,以大數據基礎軟件業務和應用與解決方案兩大類為主要產品。
相比之下,達夢更加偏向技術底座,而星環則是數據中臺的應用。
圖源星環科技招股書
相比于達夢幾乎純軟件的產品交付方式,星環除了以軟件授權方式交付外,也可以軟硬件一體的產品形式交付,并根據項目需求配套提供相關的技術服務。招股書中顯示,包含硬件產品的交付是其成本飆高的原因之一。
其中,基礎軟件服務包括大數據基礎平臺(TDH),是星環自主研發的一站式大數據基礎平臺,包括多種類型的數據格式,提供高性能的查詢搜索、實時分析、統計等功能。以數據分析和數據可視化為主,同時基于容器技術打造了數據云平臺(TDC),以PaaS云服務的方式提供給企業,完成企業級數據應用和跨多數據中心的數據平臺。
星環招股書顯示,基礎軟件服務三年內分別為2019年1.44億元(占比83.2%)、2020年1.7億元(占比65.49%)、2022年1.99億元(占比60.42%),呈逐年遞減之勢。相應的,技術服務和行業解決方案的收入占比正在逐年提高。
比如,某三甲醫院基于星環的分布式關系型數據庫,搭建了新一代臨床數據中心,對臨床數據進行統一存儲和一站式數據查詢,醫務人員可直接查詢到醫囑、病歷、檢驗、心電、超聲、病理等各類臨床數據,簡化操作流程同時提高工作效率。同時能夠查詢過去十年的患者數據,為數字化醫療建立數據指導。
總的來說,達夢的數據庫產品相對比較成熟,安全可控性高,但仍屬于傳統數據庫,在上云成為企業共識的今天,全球數據庫都在向云上轉移,尤其是初創廠商,而星環則充分利用了云數據庫存算一體、彈性伸縮的優勢,以數據中臺和解決方案切入數據庫市場。
國產數據庫的“兩座大山”
不過,即便市場規模和產品形態有所不同,但達夢和星環都面臨著數據庫行業的難點和痛點。
首先是產品的研發周期長,且研發成本居高不下。數據庫行業屬于人才、技術密集型行業,對研發人員技術水平和企業研發實力有較高要求。
從第一行代碼到進入市場的第一款數據庫產品,達夢用了近20年。雖然在路徑的選擇上,使用國外的開源數據庫進行開發周期相對比較短,但要想國產數據庫真正具有“抵抗力”,100%全自研是無法跳過的。
前期投入較大、研發門檻高,對與新興廠商來說,前期能否有足夠的資金撐過漫長的研發期,是個不小的挑戰。數據庫作為基礎軟件產品,從第一行代碼開發、到第一個版本推出、到第一個客戶落地、第一個商業場景落地,至少需要短則3年,或者更長的時間周期,且這期間需要大量的研發、人力投入和試錯成本,即便產品打磨好,找到自己的商業化道路,短時期內也較難實現盈利,比如MongoDB、達夢均是在創立10余年過后才基本達到收支平衡。
星環招股書中顯示,即便星環還未達到完全自研,但研發成本卻已經居高不下。2019~2021三年研發費用分別為1.09億元、1.094億元及 1.4億元,研發費用占營業收入的比例分別為 62.66%、42.11%和 42.46%,研發費用規模占比較高。
不過,若能堅持過自研“深水區”,便有機會能獲得一定的競爭力。縱觀Oracle數據庫的發展歷程,其在1979-2000年迭代至Oracle8之后,逐漸完善 SQL 的支持,以及PL/SQL 存儲過程,觸發器,CBO優化器,并行執行等。此后,其商業化進程一路加速,市值狂飆到1900億,雖然在2000年出現了一定的泡沫,但擠出泡沫后,保持著快速和穩定的發展。
Oracle的市值變化圖
另外,收入結構呈現出過度依賴政企大客戶的情況。
達夢招股書顯示,2019-2021年前五大客戶群體主要為大中型公司、企事業單位、黨政機關等,且前五大客戶合計收入占當年總營業收入均超過45%。
這說明目前數據庫的國產替代正在深入到商業“深水區”,傳統八大行業的數據庫替換是比較難的,如金融、交通、能源等與傳統數據庫綁定。這個階段是否能實現國產替代,需要廠商與甲方一起把傳統業務最核心的部分拿下,這是未來的機遇。
不過,數瀾科技創始人甘云峰認為,對比國外數據庫早期的客戶結構,當下屬于正常現象。“國外以微軟、甲骨文為代表,來自政府和NASA的訂單一直是其重要收入來源。”
Scale Partners勢乘資本也表示,數據資產時代來臨,全行業正在開啟數字化轉型。率先體現在各行業頭部企業及政府、軍隊等數字化進程加速,對于數據庫企業來說,聚焦優質行業、走大客戶路線成為其重要的戰略選擇。
下一步:共建行業生態
在困難出現的同時,國產數據庫的發展路徑也在逐漸清晰。
Scale Partners勢乘資本認為,數字化相關廠商沿著“能力工具化-工具平臺化-平臺智能化路徑”衍進,包含“數據采集-開發-治理-管理-挖掘-賦能業務”在內的系統性能力的搭建,已經成為普遍的客戶需求,具備綜合系統能力、精細化管理流程、極速開發效率的廠商將最先脫穎而出。
達夢和星環的產品路徑也在朝著這個方向演進。
一個較為明顯的趨勢是,達夢與星環如今不僅提供底層的數據庫產品,大數據應用平臺與數據庫一體化也正在布局。想要滿足用戶可直接用SQL處理海量數據需求,需要做到兩點:一是內核引擎強勁,提供一定性價比對外輸出海量數據分析處理能力。二是行業生態能力的搭建的完善程度。
前者需要廠商自研或兼容主流生態組件,完善產品力為進一步發展支撐。比如數據集成開發工具,包括數據集成、數據清洗、數據轉換;以及支持開發流程的可視化建模工具,包括任務發布、調度等;數據資產管理工具等。
事實上,生態能力的補齊和行業共建也是國產數據庫的機會所在。騰訊云數據庫副總經理王義成曾對光錐智能講到,“Oracle進軍中國初期,其產品能力并不是當時最強的,它能夠席卷中國的原因,還是因為整體的上下游生態完善,或者說整個服務廠商的配備齊全。在一定程度上,這樣其實在license的控制上會比較寬松。”
也就是說,當上下游生態搭建好之后,廠商和企業之間便不是單一的授權連接,而是在服務、工具、技術等多個維度進行連接,即便銷售側稍微放松一些,生態的維系也會讓企業不斷續費。
那么如何快速構建生態能力呢?就當下的形勢來講,開源是一條路徑之一。
2021年,根據DB-Engines數據,開源數據庫license數量首次超過商業數據庫。阿里旗下OceanBase、PolarDB、華為OpenGuass、騰訊Tendis、TiDB等國產數據庫產品紛紛走上開源之路,但也同時增加部分商用功能或獨立商業版本。
通過將底層技術開源,可以吸引更多人開發、測試、維護,不僅可以降低廠商售后和服務的成本,還可以進一步提高軟件質量。推廣底層軟件的使用,有利于構建生態,促進基于此基礎的上層應用開發。
甲骨文CEO Larry Ellison曾說,“開源軟件的成功既不是因為開放,也不是因為免費,而是因為它的確優秀。”
這說明行業生態共建是數字化建設的重要一環,共同開發產品、共同銷售有利于生態中各方更快實現規模化。以微軟、甲骨文為代表的廠商,通過“產品+實施+服務”的合作伙伴生態為客戶提供更多選擇,成為一站式、全球性的“企業級應用商店”,在國內數據環境飛速發展的當下,這樣的機會也就在眼前。