通過向量存儲、AutoML 和 Lakehouse 增強功能,以及 JSON 和 JAVAScript 支持,MySQL HeatWave 有效提高了易用性
Oracle 宣布將對 MySQL HeatWave 進行革新,包括支持向量存儲、生成式 AI、新增數(shù)據(jù)庫內機器學習功能、MySQL Autopilot 增強功能、新增 HeatWave Lakehouse 功能、支持 JavaScript、加速 JSON 查詢以及支持新的分析運算符。目前在私有預覽中,向量存儲支持客戶利用大型語言模型 (LLM) 的功能及專有數(shù)據(jù),其準確性比僅使用公開數(shù)據(jù)進行訓練的模型更高。通過生成式 AI 和向量存儲功能,客戶可以使用自然語言與 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各種格式的文檔。
甲骨文公司首席企業(yè)架構師 Edward Screven 表示:“此次宣布推出的 MySQL HeatWave 增強功能,是我們在解決客戶數(shù)據(jù)、分析和 AI 等緊迫問題的又一個重要里程碑。我們之前在 HeatWave 中添加了具有高性價比、自動化機器學習、湖倉一體和多云功能的實時分析。現(xiàn)在,向量存儲和生成式 AI 為客戶帶來了強大的 LLM,客戶可以用一種直觀的方式來與企業(yè)中的數(shù)據(jù)交互,并獲得業(yè)務所需的準確結果。”
為滿足希望對各種數(shù)據(jù)類型和數(shù)據(jù)源執(zhí)行分析、事務處理、機器學習和生成性 AI 的客戶,MySQL HeatWave 中增加了額外的功能,適用于與 MySQL 兼容的工作負載和非 MySQL 工作負載。
生成式 AI 和向量存儲(私有預覽)
向量存儲以各種格式(如 PDF)攝取文檔,并將其存儲為通過編碼器模型生成的嵌入。對于給定的用戶查詢,向量存儲將對所存儲的嵌入和嵌入式查詢執(zhí)行相似性搜索,識別相似度高的文檔,然后這些文檔將用于增強給 LLM 的提示,使其能夠提供更符合情境的答案。
MySQL HeatWave AutoML
MySQL HeatWave 所提供的數(shù)據(jù)庫內機器學習包含全自動化的訓練模型管道。客戶無需將數(shù)據(jù)遷移到單獨的機器學習服務中,即可輕松、安全地將存儲在 MySQL HeatWave 中的數(shù)據(jù)用于機器學習訓練、推斷和解釋。具體新增功能如下:
· HeatWave Lakehouse 支持:客戶可以利用 HeatWave AutoML訓練、推斷和解釋 MySQL 數(shù)據(jù)庫的數(shù)據(jù),以及現(xiàn)在才開始支持的對象存儲的數(shù)據(jù),并為機器學習提供更多的數(shù)據(jù)。
· 文本列支持:客戶可以對文本列執(zhí)行機器學習任務(包括異常檢測、預測、分類、回歸和推薦系統(tǒng)),進一步擴大 HeatWave AutoML 的可用數(shù)據(jù)語料庫。
· 增強型推薦系統(tǒng):現(xiàn)在,HeatWave AutoML 支持貝葉斯個性化排序 (BPR),可以基于隱式反饋(如購買歷史和瀏覽行為)和顯式反饋(如評分、點贊)來生成個性化推薦方案。例如,分析人員可以預測用戶可能會喜歡的商品、特定商品能夠吸引的用戶以及某個商品的評分。
· 訓練進度監(jiān)視器:客戶現(xiàn)在可以使用 HeatWave AutoML 監(jiān)視模型訓練的進度,從而更好地管理資源。
MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的內置功能,使用機器學習驅動的自動化來提高性能和可擴展性,并且無需具備數(shù)據(jù)庫調優(yōu)的專業(yè)知識即可操作。該功能將學習如何執(zhí)行查詢,以改進未來查詢的執(zhí)行計劃。MySQL Autopilot 新的增強功能包括:
· MySQL Autopilot 索引(限量發(fā)布):幫助客戶減少耗時的任務,包括為聯(lián)機事務處理(OLTP) 工作負載創(chuàng)建合適的索引,以及隨著工作負載的不斷變化而持續(xù)維護索引。MySQL Autopilot 可使用機器學習技術,根據(jù)各個應用工作負載進行預測,自動判斷客戶需要從表中創(chuàng)建或刪除的索引,以此優(yōu)化 OLTP 吞吐量。此外,Autopilot 索引功能還可根據(jù)推薦的索引來預測預期的改進效果,不僅無需創(chuàng)建索引,也不會對用戶的租戶產(chǎn)生計算或存儲成本。
· 自動壓縮:幫助客戶判斷適合該列的壓縮算法,加速數(shù)據(jù)壓縮和解壓,進而提高加載和查詢性能。通過減少內存使用量,客戶可以將成本降低多達 25%。
· 自適應查詢執(zhí)行:幫助客戶在查詢開始執(zhí)行后,優(yōu)化查詢的執(zhí)行計劃,將臨時查詢的性能提高多達 25%。該功能使用部分查詢中獲取的信息,調整數(shù)據(jù)結構和系統(tǒng)資源,然后根據(jù)運行時實際的數(shù)據(jù)分布,單獨優(yōu)化每個 HeatWave 節(jié)點的查詢執(zhí)行。
· 自動加載和卸載:Autopilot 可自動將應用工作負載中使用的列加載到 HeatWave,并自動卸載從未查詢或很少查詢的表。這有助于釋放內存,降低客戶的成本,并且無需手動執(zhí)行此任務。
其他 MySQL HeatWave 增強功能
· JavaScript 支持(限量發(fā)布):客戶可以在 JavaScript 中寫入存儲過程和函數(shù),然后在 MySQL HeatWave 中執(zhí)行。有鑒于此,開發(fā)人員可以在 JavaScript 中編寫豐富的應用邏輯,并通過在 MySQL 數(shù)據(jù)庫中執(zhí)行程序來獲得高性能。JavaScript 應用的性能得以有效提升,因為數(shù)據(jù)無需從數(shù)據(jù)庫遷移到客戶端,并且代碼可在 GraalVM 運行時即時 (JIT) 編譯。
· JSON 加速:開發(fā)人員和數(shù)據(jù)庫管理員(DBA)現(xiàn)在可以利用 HeatWave,對存儲在 MySQL 數(shù)據(jù)庫中的 JSON 文檔進行實時分析,從而將查詢速度提高幾個數(shù)量級。
· 新的分析運算符:通過新支持的分析運算符(包括 CUBE、Hyper Log、Qualify 和 Table 示例),客戶可以將更多工作負載遷移到 MySQL HeatWave。
· 批量攝取到 MySQL HeatWave:在從 CSV 文件批量加載數(shù)據(jù)的同時,并行構建索引子樹,幫助客戶實現(xiàn)更高的數(shù)據(jù)攝取性能,從而可以更快地查詢數(shù)據(jù),這意味著能夠更快地釋放用于加載數(shù)據(jù)的系統(tǒng)資源,降低客戶的成本。
NAND Research 首席分析師兼創(chuàng)始合伙人 Steve McDowell 表示:“MySQL HeatWave 工程團隊顯然正在加大 AI 和機器學習的創(chuàng)新力度。現(xiàn)在,客戶不僅能夠以全面自動化的方式,使用數(shù)據(jù)庫和對象存儲中的數(shù)據(jù)進行機器學習模型訓練,還可以借助全新的 AI 和向量存儲功能,以自然語言與 HeatWave 進行交互。相關的模型訓練除了使用公開提供的數(shù)據(jù)外,也使用了企業(yè)自己的數(shù)據(jù),讓客戶能夠獲得精準符合業(yè)務目的的答案。客戶可以自由選擇 LLM,而這一點凸顯了 MySQL HeatWave 工程團隊的開放式協(xié)作策略。”
MySQL HeatWave 可在一個 MySQL 數(shù)據(jù)庫服務中提供事務處理、實時分析、機器學習、數(shù)據(jù)池查詢和基于機器學習的自動化功能。作為 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 和 Amazon Web Services 中原生提供,作為 Oracle Database Service for Azure 的一部分提供,以及通過 OCI Dedicated Region 在客戶數(shù)據(jù)中心內提供。