近日,Gartner 發(fā)布技術(shù)成熟度曲線《Hype Cycle for Data, Analytics and AI in China, 2023》,偶數(shù)科技本次入選湖倉一體代表廠商,這是繼在去年偶數(shù)榮獲Gartner“酷”廠商(《Cool Vendors in Data Management, China》)后再次得到權(quán)威機(jī)構(gòu)認(rèn)可,偶數(shù)科技在大數(shù)據(jù)領(lǐng)域的技術(shù)優(yōu)勢(shì)正被越來越多的組織和機(jī)構(gòu)所認(rèn)可。
什么是技術(shù)成熟度曲線Hype Cycle?
技術(shù)成熟度曲線是通過圖形化來描述和呈現(xiàn)前沿技術(shù)發(fā)展階段的,由全球著名咨詢機(jī)構(gòu) Gartner 每年一次發(fā)布一次。曲線由五個(gè)部分組成,分別對(duì)應(yīng)了新技術(shù)發(fā)展的五個(gè)階段:技術(shù)剛剛流行的啟動(dòng)期、隨著關(guān)注度提升的熱門關(guān)注期、熱度下降的低谷期、爬升期、高原期。
(1) 啟動(dòng)期(Innovation Trigger)該技術(shù)剛剛誕生,還只是一個(gè)概念,不具有可用性,無法評(píng)估商業(yè)潛力。媒體有所報(bào)道,引起了外界的興趣。
(2) 熱門關(guān)注期(Peak of Inflated Expectations)該技術(shù)逐步成型,出現(xiàn)了成功的案例,一些敏銳的公司開始跟進(jìn)。媒體開始大肆報(bào)導(dǎo),產(chǎn)品的知名度達(dá)到高峰。
(3) 低谷期(Trough of Disillusionment)隨著競爭者的加劇,優(yōu)勝劣汰開始出現(xiàn),只有擁有核心技術(shù)和找到成功商業(yè)模式的公司存活下來。媒體對(duì)它的報(bào)道逐步冷卻。
(4) 爬升期(Slope of Enlightenment)該技術(shù)的優(yōu)缺點(diǎn)越來越明顯,細(xì)節(jié)逐漸清晰,越來越多的人開始理解它。基于它的第二代和第三代產(chǎn)品出現(xiàn),更多的企業(yè)開始嘗試,可復(fù)制的成功使用模式出現(xiàn)。媒體重新認(rèn)識(shí)它,業(yè)界這一次給予了高度的理性的關(guān)注。
(5) 高原期(Plateau of Productivity)經(jīng)過不斷發(fā)展,該技術(shù)慢慢成為了主流。技術(shù)標(biāo)準(zhǔn)得到了清晰定義,使用起來越發(fā)方便好用,市場(chǎng)占有率越來越高,進(jìn)入穩(wěn)定應(yīng)用階段。配合它的工具和最佳實(shí)踐,經(jīng)過數(shù)代的演進(jìn),也變得非常成熟了。業(yè)界對(duì)它有了公認(rèn)的一致的評(píng)價(jià)。
湖倉一體(Lakehouse)處于什么時(shí)期?
Gartner 認(rèn)為,湖倉一體(Lakehouse)是一個(gè)將數(shù)據(jù)湖的靈活性和數(shù)據(jù)倉庫的規(guī)范性、易用性和高性能的特點(diǎn)結(jié)合起來的融合基礎(chǔ)架構(gòu),無物理和邏輯的數(shù)據(jù)孤島。可以高效支持海量高頻的原始數(shù)據(jù)收集和存儲(chǔ),支持高并發(fā)多模態(tài)的數(shù)據(jù)深度加工和最終數(shù)據(jù)的使用。
湖倉一體作為大數(shù)據(jù)最前沿的技術(shù),目前正在快速發(fā)展當(dāng)中。根據(jù)成熟度曲線,目前已經(jīng)過了啟動(dòng)期,即將處于熱門關(guān)注期。
作為代表廠商,偶數(shù)的湖倉一體有何不同?
如Gartner在報(bào)告中所稱,新技術(shù)的誕生在早期概念模糊,魚龍混雜。于是,偶數(shù)在2022年發(fā)布了湖倉一體ANCHOR標(biāo)準(zhǔn),并作為國內(nèi)湖倉一體技術(shù)領(lǐng)域的代表廠商聯(lián)合信通院發(fā)布了國內(nèi)首個(gè)《云原生湖倉一體白皮書》。
在偶數(shù)的定義中,湖倉一體應(yīng)該包含以下六個(gè)特征:
All Disparate Data(多源異構(gòu)數(shù)據(jù)):支持關(guān)系表、文本、圖像、視頻等結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。
Native on Cloud(云原生):適合云環(huán)境,自由增減計(jì)算和存儲(chǔ)資源,按用量計(jì)費(fèi),節(jié)約成本。
Consistency(數(shù)據(jù)一致性):通過完善的事務(wù)機(jī)制,保障不同用戶同時(shí)查詢和更新同一份數(shù)據(jù)時(shí)的一致性。
High Concurrency(超高并發(fā)):支持?jǐn)?shù)十萬用戶使用復(fù)雜分析查詢并發(fā)訪問同一份數(shù)據(jù)。
One Copy of Data(一份數(shù)據(jù)):通過開放的數(shù)據(jù)格式,讓所有用戶(BI用戶、數(shù)據(jù)科學(xué)家等)可以共享同一份數(shù)據(jù),避免數(shù)據(jù)孤島。
Real-Time(實(shí)時(shí)T+0):通過全量數(shù)據(jù)T+0的流處理和實(shí)時(shí)按需查詢,滿足基于數(shù)據(jù)的事前預(yù)測(cè)、事中判斷和事后分析。
湖倉一體的商業(yè)前景
Gartner 認(rèn)為湖倉一體的重要性在于其實(shí)現(xiàn)了以數(shù)據(jù)探索為導(dǎo)向的分析和模型開發(fā)(通過湖部分),和用于數(shù)據(jù)分析洞察和可衡量的價(jià)值(通過數(shù)倉部分)。企業(yè)將從更簡化的交付、更快的數(shù)據(jù)訪問以及支持高技能數(shù)據(jù)科學(xué)家、工程師和分析師的集成數(shù)據(jù)管理平臺(tái)中受益,同時(shí)還包括使用BI工具進(jìn)行數(shù)據(jù)分析的普通用戶。
目前,偶數(shù)的湖倉一體已經(jīng)在金融、電信、能源和互聯(lián)網(wǎng)等行業(yè)中得到應(yīng)用,同時(shí),其技術(shù)優(yōu)勢(shì)與成長性也得到了諸如建設(shè)銀行、中國移動(dòng)等頭部客戶的認(rèn)可。