8 月 24 - 26 日,“中國財險科技應用高峰論壇”在北京召開。 PingCAP 副總裁劉松在大會中分享了主題為《TiDB分布式數據庫在保險行業關鍵應用場景的探索與實踐》的演講,從財險核心場景創新,到基礎軟件行業趨勢做了深入分析,并結合保險數字化趨勢,展望了保險數字化未來的可能性。
新技術環境:“開源+云”的互相推動與演進
過去 20 年,從互聯網創新到數字化,背后有著兩個重要趨勢:一是“開源”,二是“云”。其中,開源經歷了幾個不同的發展階段。第一代開源是 90 年代以 Linux 為代表的的開源運動,主要是對抗閉源軟件;第二代開源是 2000 年代,所有移動互聯網公司的數字平臺都開始采用以開源為主的技術棧。這個時代中,從互聯網技術棧中產生了一種重要的 IT 服務形態——云計算;到 2015 年后,隨著云計算的 IaaS 層規模越來越龐大以及多云、云原生的興起,開源也進入了第三代。 新一代的開源已經不是互聯網公司自己家里的開源,而是每一個用戶都在用的開源。最重要的軟件技術都已經變成原生開源為主的,再結合云計算 2.0 服務形態,形成了“開源+多云”的技術生態。今天,我們正處在開源 3.0 和云計算 2.0 結合的早期階段。
從現在開始到 2030 - 2035 年間,全世界最重要的基礎軟件技術將多數來自開源項目,如新一代的 Sa人工智能、物聯網、區塊鏈、低代碼、云原生等技術的源頭都將是開源,構成了一個個技術引擎。而云計算就像“組裝汽車”,可以把好的開源技術引擎組合成云服務交付給用戶。開源打造“引擎”,借助云組裝成“汽車”,幫助每一個客戶更容易走向自己的數字化旅程。這三者形成了一個數字化創新三角,所有技術都會被“開源、云”這兩個關鍵技術重新塑造,這也是未來 10-15 年整個軟件行業的主導形態。因為這個大三角的技術環境,今天的數據庫和 20 年前的數據庫已經有了天壤之別。20 年前,數據庫還主要是信息化的交易系統,而今天的數據庫既能解決交易系統問題,又要解決大數據分析問題,還要和云廠商結合做云原生的創新,以及通過AI更快的發現數據的價值。在這一趨勢影響下,有分析機構預測,未來 5 年所有行業的數字化創新速度,會是過去 10 年的 5-10 倍。
TiDB :融合開源和云兩個生態的價值
TiDB 是 2015 年創立的全球性開源項目,它處在第三代開源時代起始,一開始就是云原生的狀態,在將開源的快速迭代能力和云的敏捷性相結合后,使得 TiDB 這樣一個開源數據庫只用了 7 年時間,就成為中國最流行的數據庫,在墨天輪國產數據庫排行榜上一直保持第一名位置。在 Gartner 2022 云數據庫“客戶之聲”中,PingCAP 成為中國唯一入選的分布式云數據庫服務商。沙利文頭豹研究院也將 TiDB 放在《2021 年中國分布式數據庫市場報告》領導者象限。
中國基礎軟件全球化創新之路——自主開源模式
在 TiDB 的成長歷程中,最重要的一個關鍵詞就是“自主開源”的發展模式,該模式經過 7 年多的實踐,得到了客戶、分析機構的認可,也獲得政府機構極大的肯定。現在業界和金融行業里都有了一個新的認知:唯有真正自主開源才能從根本上解決卡脖子問題,并持續保持領先性。這種發展路徑不是簡單地去替代他人的過去,而是使我們的技術始終保持在世界前列,構建一個“開源和多云”的新生態。今天選擇 TiDB 不只是解決今天的問題,10 年以后它在全球也將是最先進的數據庫。
眾所周知,數據庫市場有很多流派,很多品牌的數據是一個品牌的名字,在一個品牌下面又有很多的技術棧,對于大多數客戶而言,數據庫用起來通常都很復雜,往往一個項目涉及N多產品的集成,那么能不能有一個簡單而強大的數據庫呢? TiDB 只有一個產品,它可以在公有云上、私有云上,行業云上、客戶的數據中心里部署。只要懂 SQL ,用戶就能以一種統一的體驗解決自己業務和應用的問題。
TiDB 的很多大型客戶已經以 1+N 的方式在部署 TiDB,他們在數據庫核心系統用 TiDB 企業級版本,在云上部署一個 TiDB 的云數據庫。用戶可以自動擴容解決海量數據規模,TiDB 最大的用戶已經有近千臺節點。所以,無論是對數字原生企業,還是數字轉型企業,比如保險行業,在做數字化轉型時,都會讓用戶沒有任何負擔地去使用數據庫,同時簡單而強大,不用關心它的部署模式。
借助開源模式最大的好處就是能夠最快速度獲取用戶,有一些比 TiDB 成立還早的公司到現在也只有 100到200 個客戶,而 TiDB 在全球已經擁有超過 3000 多家用戶,不乏一些頂級的技術巨頭,包括美國、日本、東南亞的客戶,中國的銀行和保險行業客戶。作為一個第三代開源和云原生的數據庫,TiDB 可以天然服務于數字化企業,現在還在把這種能力傳遞給更多經典傳統行業進行數字化轉型。
數字化創新三層結構
如上圖所示,產業界發展到了這個時候,出現了明顯分層。最底層做云基礎設施的,不管是公有云、私有云,還是混合云,IaaS 層已經足夠大,足夠穩定。最上層的是的類似中科軟這樣的大型應用軟件供應商,主要做端上的創新,如私域運營、會員等。而未來世界最重要的中堅力量將來自于數據價值的創新,新一代數據庫會逐漸結合大數據技術和人工智能技術,形成相對獨立的中間層。這一層既是開源又是多云的,向上對業務的場景支撐會更直接,向下對于云資源的運用會更加智能。對于所有面向客戶經營的業務和面向業務人員的客戶,他們希望有一個一棧式的技術棧,既解決實時交易,又能分析業務,這相當于是一個數據的“任意門”,這邊做保險的核心交易,同時在另一邊又能看到數據大屏和評估可能的業務風險。
TiDB 的定位便是如此,以一個統一的數據服務層,同時面對海量交易和實時分析,能夠滿足巨大的吞吐量和各種各樣的數據分析要求。作為一個原生的分布式數據庫,TiDB 可以從 1TB 擴展到 1PB,從單機版數據庫覆蓋的范圍,一直拓展到大數據覆蓋的范圍。同時,開放的 TiDB 還可以和其他大多數數據湖、數據倉架構相融合。
TiDB 分布式數據庫在財險的應用
A 財險巨頭的單證系統面臨著數據量增長迅速、業務并發量高、處理性能低等挑戰,傳統 IOE 架構下需要依賴昂貴的高端服務器,軟硬件及服務成本非常高,業務方希望能有一個 HTAP 數據庫,既滿足單個訂單的快速處理,又滿足批量訂單的分析處理,實現降本增效的目標。傳統的數據庫產品面臨著許多技術難題,海量數據下系統能不能自動伸縮擴展?有沒有單點故障?TP 響應時間長,AP 分析報表時間達小時級,這些問題解法只有通過新一代的原生分布式數據庫才能解決。
TiDB 基于原生分布式架構,計算存儲分離設計,可在線彈性擴縮容。HTAP 一棧式架構支持混合負載,支持高并發實時交易業務和復雜分析查詢,可實現毫秒級的 TP 與秒級的 AP 查詢能力,并且具有良好的物理隔離性與數據強一致性。TiDB 還高度兼容 MySQL 生態,從用戶視角看上去就是在用一個大號的 MySQL,但是容量高了 1-2 個數量級,價格卻低了 1-2 個數量級。同時,TiDB 在國產化適配方面與主流國產服務器及操作系統兼容適配, 與 170 多家合作伙伴形成上下游的整體生態。
在該財險案例中,通過從 Oracle 遷移到 TiDB ,在單證的交易系統中,平均時長從分鐘級提升到秒級,效率提升達到幾十倍,在分析方面甚至有上百倍的性能提升,這就是新一代分布式數據庫架構優勢帶來的價值。同時,原生分布式數據庫帶來的天然的彈性擴展和高可用可以保障保險業務的高速增長。
與 A 財險不同,B 保險集團是先從互聯網業務開始接觸 TiDB 的,彼時傳統單機版數據庫和云數據庫都支撐不住其互聯網業務 APP 的快速發展。于是,TiDB 從外圍到核心,切入到多個互聯網業務系統,陸續支持客戶信息管理系統,幫助 B 保險集團的硬件成本節省超過 30% 以上。在第二階段,TiDB 繼續挺近客戶統一營銷活動管理、客戶信息核心管理、保單服務、理賠等多個業務系統中,助力坐席電話銷售中心的實時大屏等創新場景,幫助客戶系統實現邊交易、邊分析,提升業務系統的數據實時分析能力。第三階段,客戶通過 TiDB 實現自主創新,實現產險、財險、普惠金融等多個業務單元的核心系統替換。未來, B 保險集團還希望通過 TiDB 實現更多的數據自主和對于多云架構的兼容。
在此過程中,B 保險集團還基于 TiDB 的版本開發出自己的數據庫版本。開源帶來的好處是所有的代碼都是全透明的,不需要依賴于上游的變化,可以打造自己的特定保險行業的自主創新體系,并不斷演進。
保險數字化:進入融合發展時代
保險行業已經經歷了物理網點時代、渠道時代、互聯網時代,目前形成了以移動互聯網為代表的端側客戶運營和會員體系。再下一代可能是什么?保險將無處不在。未來的場景和產業只要有“焦慮”,就會有保險的機會,都需要將保險融到其中,所以這將是一個“融合時代”。
目前,保險行業解決了人的安全需求,如人身焦慮、財產擔心、常見的車損等等。在未來的元宇宙、web 3.0 等虛擬世界中,如何保障虛擬財產的損失,區塊鏈會不會給保險行業帶來數據所有權的根本性變化?這將帶給保險人更多的想象空間,未來保險行業肯定也會產生新的形態,既要尊重人的社會需求,又要考慮新技術帶來的更多可能性。