近期,巨杉數(shù)據(jù)庫(kù)舉行線上發(fā)布會(huì),發(fā)布基于「湖倉(cāng)一體」架構(gòu)的v5.2版本,提升多項(xiàng)「實(shí)時(shí)」能力,詮釋公司「釋放全量數(shù)據(jù)價(jià)值」的價(jià)值主張。深度解析在數(shù)字化時(shí)代下,基于湖倉(cāng)一體架構(gòu)的SequoiaDB如何圍繞金融銀行業(yè)的實(shí)時(shí)需求,全面提升結(jié)構(gòu)化查詢分析、非結(jié)構(gòu)化存取、性能監(jiān)控故障診斷及數(shù)據(jù)生命周期管理的四大能力,讓全量數(shù)據(jù)的價(jià)值從「內(nèi)部離線」向「實(shí)時(shí)對(duì)客」進(jìn)一步釋放。會(huì)中,賽迪咨詢深度解讀全國(guó)首個(gè)《湖倉(cāng)一體技術(shù)研究報(bào)告》,詳細(xì)介紹湖倉(cāng)一體架構(gòu)的興起與未來(lái)發(fā)展方向。
巨杉基于數(shù)據(jù)湖的實(shí)時(shí)能力已經(jīng)達(dá)到全球領(lǐng)先,技術(shù)實(shí)力得到了金融頭部客戶的認(rèn)可,產(chǎn)品已在超過(guò)100家金融銀行客戶規(guī)模化生產(chǎn)上線,其中不乏中國(guó)人保、民生銀行、南方電網(wǎng)、中國(guó)太平保險(xiǎn)等世界500強(qiáng)企業(yè)及廣發(fā)銀行、廣東省農(nóng)信等典型客戶。SequoiaDB更服務(wù)于多個(gè)政府平臺(tái),如支持“粵省事”平臺(tái)的醫(yī)保、社保數(shù)據(jù)查詢,這些數(shù)據(jù)也助力新冠核酸檢測(cè),幫助政府匹配核酸檢測(cè)情況。
雙核心:交易核心+數(shù)據(jù)核心,讓全量數(shù)據(jù)實(shí)時(shí)可得
過(guò)去的10年,伴隨數(shù)字化的深化發(fā)展,企業(yè)不但需要面向業(yè)務(wù)交易的信息化傳統(tǒng)「交易核心」,同時(shí)更需要面向數(shù)據(jù)價(jià)值的「數(shù)據(jù)核心」。
信息化時(shí)代,「交易核心」解決的是交易系統(tǒng)的問(wèn)題,面向渠道、產(chǎn)品、客戶、核算及清算等業(yè)務(wù)流程,確保業(yè)務(wù)閉環(huán)。其交易過(guò)程產(chǎn)生的海量流水?dāng)?shù)據(jù),將成為「數(shù)據(jù)核心」的生產(chǎn)要素。
數(shù)字化時(shí)代,「數(shù)據(jù)核心」解決的是數(shù)據(jù)的采集、整理、聚合、運(yùn)用等問(wèn)題。數(shù)字化新核心將為信息化「交易核心」提供實(shí)時(shí)、跨業(yè)務(wù)的全量數(shù)據(jù),以及基于數(shù)據(jù)的決策依據(jù),實(shí)現(xiàn)數(shù)據(jù)價(jià)值的持續(xù)釋放。
「實(shí)時(shí)」是「釋放全量數(shù)據(jù)價(jià)值」的關(guān)鍵。10年前,巨杉數(shù)據(jù)庫(kù)就意識(shí)到,數(shù)據(jù)會(huì)成為社會(huì)發(fā)展關(guān)鍵的要素資源,需要提供面向全量數(shù)據(jù)的實(shí)時(shí)對(duì)客及高并發(fā)處理能力。業(yè)界遇到的普遍痛點(diǎn)是,面向「交易核心」的數(shù)據(jù)庫(kù)因架構(gòu)及技術(shù)限制僅能服務(wù)于指定的業(yè)務(wù)系統(tǒng),且無(wú)法處理全量數(shù)據(jù);以Hadoop為代表的大數(shù)據(jù)產(chǎn)品雖然可以存放全量數(shù)據(jù),但無(wú)法提供實(shí)時(shí)處理能力,兩者皆無(wú)法滿足全量數(shù)據(jù)實(shí)時(shí)對(duì)客服務(wù)的發(fā)展需求。因此巨杉毅然開(kāi)始了自研原生分布式數(shù)據(jù)庫(kù)內(nèi)核的道路,從「多模數(shù)據(jù)湖」、「實(shí)時(shí)數(shù)據(jù)湖」發(fā)展到「湖倉(cāng)一體」,為客戶提供「數(shù)據(jù)核心」所需的全量數(shù)據(jù)存儲(chǔ),實(shí)時(shí)對(duì)客服務(wù),及基于統(tǒng)一數(shù)據(jù)源的分析能力,充分激活客戶的離線數(shù)據(jù)。
四大實(shí)時(shí)能力提升,SequoiaDB v5.2釋放全量數(shù)據(jù)價(jià)值
巨杉數(shù)據(jù)庫(kù)基于湖倉(cāng)一體架構(gòu)的SequoiaDB v5.2版本進(jìn)行了多項(xiàng)更新,此次發(fā)布會(huì)主要介紹了四大實(shí)時(shí)特性的能力提升。即將發(fā)布的SequoiaDB v5.2版本讓全量數(shù)據(jù)的價(jià)值從「內(nèi)部離線」向「實(shí)時(shí)對(duì)客」進(jìn)一步釋放。
查詢更實(shí)時(shí),所有數(shù)據(jù)可毫秒級(jí)訪問(wèn)。面向結(jié)構(gòu)化數(shù)據(jù),SequoiaDB v5.2版本提供深度的Join優(yōu)化及列存微分區(qū)技術(shù),在多個(gè)查詢場(chǎng)景下,性能達(dá)到了毫秒級(jí)實(shí)時(shí)返回;分析場(chǎng)景中,性能更獲得了10倍以上提升,讓數(shù)據(jù)湖的查詢分析更實(shí)時(shí)。
存取更實(shí)時(shí),吞吐量提升30%以上。面向非結(jié)構(gòu)化數(shù)據(jù),巨杉通過(guò)「分片并發(fā)」及「可變分區(qū)大小」的技術(shù),相比原有版本,SequoiaDB v5.2版本吞吐量提升30%以上,讓數(shù)據(jù)湖的非結(jié)構(gòu)化數(shù)據(jù)存取更實(shí)時(shí)。
診斷更實(shí)時(shí),業(yè)務(wù)問(wèn)題分鐘級(jí)定位。發(fā)布會(huì)上,巨杉數(shù)據(jù)庫(kù)發(fā)布SAC運(yùn)維管理工具的重要特性更新,運(yùn)行監(jiān)控方面提供了全GUI的性能及故障分析能力,SAC基于分布式架構(gòu)的實(shí)時(shí)診斷,可實(shí)現(xiàn)業(yè)務(wù)問(wèn)題分鐘級(jí)定位。
全量數(shù)據(jù)生命周期管理,提升人效及能效。部署架構(gòu)方面,支持多配置硬件的混合部署,針對(duì)高并發(fā)數(shù)據(jù)與低并發(fā)數(shù)據(jù),做到按需調(diào)度;面向橫跨結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),提供一體化的開(kāi)發(fā)及管理能力,提升人效及能效,在成本可控的前提下,實(shí)現(xiàn)全量數(shù)據(jù)實(shí)時(shí)可用。
技術(shù)迭代互補(bǔ),而非替代
巨杉數(shù)據(jù)庫(kù)深耕第三代分布式數(shù)據(jù)庫(kù)技術(shù),我們認(rèn)為分布式數(shù)據(jù)庫(kù)的星辰大海,絕不僅限于對(duì)交易核心數(shù)據(jù)庫(kù)的替代。SequoiaDB正通過(guò)湖倉(cāng)一體架構(gòu)提供面向多模、實(shí)時(shí)、分析的需求,與各類(lèi)集中式及分布式交易核心數(shù)據(jù)庫(kù)成為上下游合作伙伴,釋放全量數(shù)據(jù)價(jià)值。
巨杉數(shù)據(jù)庫(kù)SequoiaDB通過(guò)基于「湖倉(cāng)一體」架構(gòu),支撐企業(yè)的「數(shù)據(jù)核心」。從企業(yè)多個(gè)「交易核心」數(shù)據(jù)庫(kù)所產(chǎn)生的業(yè)務(wù)流水?dāng)?shù)據(jù),可以以流式入湖的方式,秒級(jí)匯聚到SequoiaDB形成全量數(shù)據(jù)底座。
實(shí)時(shí)數(shù)據(jù)湖:為不同業(yè)務(wù)的跨系統(tǒng)查詢,或多年流水?dāng)?shù)據(jù)獲取,提供高并發(fā)的實(shí)時(shí)查詢能力,所有數(shù)據(jù)實(shí)時(shí)可得。相比原來(lái)跨多系統(tǒng)進(jìn)行數(shù)據(jù)異構(gòu)訪問(wèn)的方式,SequoiaDB協(xié)助客戶將業(yè)務(wù)響應(yīng)時(shí)間從分鐘、小時(shí)級(jí)延遲,到秒級(jí)延遲的改變,讓用戶滿意度獲得大幅提升。
多模數(shù)據(jù)湖:為影像系統(tǒng)、遠(yuǎn)程銀行等需要大量管理非結(jié)構(gòu)化數(shù)據(jù)的系統(tǒng),提供多模數(shù)據(jù)湖技術(shù)重點(diǎn)優(yōu)化非結(jié)構(gòu)化對(duì)象數(shù)據(jù)的高并發(fā)實(shí)時(shí)存取能力,實(shí)現(xiàn)跨多數(shù)據(jù)類(lèi)型的一體化管理,提升研發(fā)及運(yùn)維的“人效”。
實(shí)時(shí)數(shù)倉(cāng):在數(shù)據(jù)湖內(nèi)提供高性能分析引擎,可以協(xié)助企業(yè)基于準(zhǔn)確而且統(tǒng)一的數(shù)據(jù)源,進(jìn)行數(shù)據(jù)的實(shí)時(shí)探索及分析、統(tǒng)計(jì)、加工,降低數(shù)據(jù)再次流動(dòng)的開(kāi)銷(xiāo),提升數(shù)據(jù)處理“能效”,構(gòu)建綠色低碳的數(shù)據(jù)基礎(chǔ)設(shè)施。
發(fā)布會(huì)上,賽迪咨詢也對(duì)全國(guó)首篇《湖倉(cāng)一體技術(shù)研究報(bào)告》進(jìn)行深度解讀,將湖倉(cāng)一體技術(shù)定義為未來(lái)發(fā)展趨勢(shì)。
未來(lái),巨杉數(shù)據(jù)庫(kù)SequoiaDB也將持續(xù)聚焦于分布式特性,通過(guò)「湖倉(cāng)一體」架構(gòu)為客戶打造「數(shù)據(jù)核心數(shù)據(jù)庫(kù)」,成為數(shù)字化時(shí)代下堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施。在“信創(chuàng)”產(chǎn)業(yè)中,堅(jiān)持踐行信息技術(shù)應(yīng)用創(chuàng)新的理念,服務(wù)于企業(yè)全量數(shù)據(jù)實(shí)時(shí)業(yè)務(wù)場(chǎng)景,與各類(lèi)集中式及分布式交易核心數(shù)據(jù)庫(kù)成為上下游合作伙伴,驅(qū)動(dòng)數(shù)字化的業(yè)務(wù)的創(chuàng)新發(fā)展,以湖倉(cāng)一體釋放全量數(shù)據(jù)價(jià)值。