數據庫是高效組織、存儲、管理數據的軟件,是構建信息世界的基礎工具。從第一款商業化關系數據庫誕生開始,數據庫管理系統已經走過40多年的歷史,起初都是單機形式,隨著數字經濟的到來,數據量呈現爆發式增長,傳統的單機數據庫在業務支撐、成本、開放性等方面挑戰巨大,尤其是“雙十一、618、春節搶紅包”等場景下,每秒都有上百萬筆支付交易,數據庫的讀寫性能嚴重下降。
中國移動通信聯合會數字經濟產業委員會主任凌發明先生指出,傳統的集中式架構數據庫在很多場景下顯得捉襟見肘,新型的分布式架構數據庫將成為數據庫技術研究和應用的熱點。
分布式數據庫應運而生
傳統關系型數據庫在核心交易等領域深耕了40多年,到目前為止,大部分純交易場景不論從數據量還是商業模式都沒有本質的變化,其業務的擴展空間也十分有限。而在企業數字化轉型的過程中,數據量會隨著業務發展快速膨脹,形成全新的業務需求及數據增量,為數據庫帶來全新的市場機遇。
相比傳統關系型數據庫,分布式數據庫在提供ACID事務一致性的能力的同時,擁有更靈活的擴展能力,及多數據模型的處理能力。使用分布式數據庫逐步迭代,伴隨全新的數字化業務漸漸滲透到傳統業務,成為新的數據核心場景,是分布式數據庫技術在企業中最佳的落地方案。
分布式數據庫
或為數字化轉型進程中企業的優選項
分布式數據庫的主要特點有三個:一是透明性。對于用戶來說,分布式數據庫相當于一個單機數據庫,屏蔽了底層多節點、數據物理分散、副本一致性等細節問題;二是數據冗余性。分布式數據庫通過多副本來實現系統可靠性和可用性,當某一節點中的數據不可用時,其他數據副本可以繼續保證業務的連續性,還可以對數據就近計算,減少網絡消耗,提升性能;三是易擴展性。分布式數據庫能夠通過水平擴展來提升整體的處理能力,數據可以被動態地分布到新增節點之上,消除數據傾斜。分布式數據庫的核心技術包括數據復制,即不同副本之間的數據同步機制;數據分區,即如何將海量數據分布到不同節點中;分布式事務,即解決多節點面臨的原子性、一致性、隔離性、持久性挑戰。
凌發明先生表示分布式數據庫可輕松處理海量數據模型,滿足數字化轉型帶來的數據量大、數據異構等多元需求,或為數字化轉型進程中企業的優選項。
分布式數據庫技術發展趨勢
目前,國內絕大部分數據庫企業均推出了分布式數據庫產品,我國分布式數據庫發展基本與國際同步,在一些技術指標和應用層面甚至處于領先水平。在未來,分布式數據庫的產品化日趨成熟,隨著分布式數據庫等的標準體系及評價體系的健全,分布式數據庫產品的生態體系也將逐漸完善,在運維保障、數據遷移、運行監測等方面的配套工具也將逐步成熟。
另外,隨著人工智能技術的發展,將人工智能技術融入分布式數據庫的全生命周期,實現自運維、自管理、自調優、故障自診斷和自愈,是未來發展的必然趨勢。
隨著云計算、人工智能、新型硬件的發展,數據庫的架構隨之發生變化。為適配云的發展,計算和存儲分離成為一個必然趨勢,誕生了諸多云原生數據庫。而人工智能技術的演進為數據庫集群的運維、調優提供了新的思路。新的網絡、存儲、芯片的迭代更新進一步推動了數據庫架構的變化,眾多數據庫廠商都在積極嘗試利用新的硬件能力來提升性能。
總結
分布式數據庫的誕生首先是為了解決傳統數據庫不擅長的場景,在關系型數據庫做到極致的領域同樣需要很長的時間才能完善。得益于高彈性、強事務一致、多模融合等特點,分布式數據庫的應用領域幾乎每年都會有大幅度擴展,成為支撐企業數字化改革升級中不可或缺的彈性數據基礎設施。
回顧過去的10年,分布式數據庫經歷了從行業質疑、小規模試水、到如今在部分行業的規模化應用。我們堅信,在新的一年中我國的分布式數據庫產業一定會更加蓬勃發展,未來的三到五年分布式數據庫的應用規模有望超越Oracle成為核心交易業務的重要組成部分。未來,隨著5G、分布式技術、云計算技術的不斷發展,及各行業數字化轉型的不斷深入,數據庫云化、數據庫云原生架構已成為趨勢,計算、存儲分離,采用共享存儲的方式是數字化轉型的企業共同的選擇。
凌發明先生認為,作為數字經濟建設的重要基礎設施,分布式存儲與區塊鏈的結合,在科技、社會等各個層面都會對未來帶來深刻影響,加快推動我國數字化轉型進程,促使經濟社會發生深刻變革。