大語言模型正在與企業應用迅速結合,并深刻改變企業的各個產業環節。而大模型訓練所使用的數據包含了如文檔、圖片、音視頻等各種類型的非結構化數據,傳統關系型數據庫能力有限。通過將這些非結構化數據轉換為多維向量,可以結構化地在向量數據庫中進行管理,實現高效的數據存儲和檢索過程,結合相似性檢索特性,可以有效地解決大模型在知識時效性低、輸入能力有限、準確度低等問題。
星環科技Transwarp Hippo作為一款企業級云原生分布式向量數據庫,自發布以來受到了眾多用戶的歡迎,幫助用戶實現向量數據的存儲、管理和檢索,加速大模型場景的探索和實踐。為了進一步降低用戶使用向量數據庫的門檻和成本,Hippo推出Community Edition社區版,單機即可安裝部署,開箱即用,并支持多種接口、向量/標量數據實時更新,以及多種向量檢索,幫助用戶低成本、快速地進行大模型場景的探索,如構建知識庫、智能問答機器人等。
極簡資源,極速安裝
Hippo社區版僅需單臺服務器即可安裝部署,百萬級向量數據量推薦配置僅需4核8G。all-in-one全內置設計,做到開箱即用,整個安裝過程最快僅需3分鐘,即可上手體驗。
Hippo安裝流程
Hippo社區版安裝教程
多種接口、多種檢索,簡單易用
Hippo社區版提供標準的Python、Restful、Java API等接口,可輕松對接各類應用和模型,提高應用開發和調用的效率。同時,提供類SQL接口,滿足入庫等特定場景,大幅降低使用和操作的難度。
Hippo社區版支持樹索引和位圖索引,支持向量topk搜索、向量/標量混合搜索和向量相似度過濾,可滿足多種不同的檢索場景。
簡單3步,快速搭建私有知識庫
基于Hippo社區版,用戶可快速搭建私有知識庫。
第一步:安裝向量數據庫Hippo社區版、embedding model,并驗證;
第二步:知識入庫,將語料文檔通過embedding model轉化為向量,存儲到Hippo中;
第三步:調用大模型,并測試連通性。
基于以上3步,即可開始智能問答。
當用戶發起提問時,運轉流程如下:
* 向量轉化并檢索,通過embedding model將用戶問題轉化為向量,并作為Hippo的查詢條件進行查詢;
* 構建prompt,將檢索信息與用戶問題進行拼接構造prompt,作為大模型的輸入;
* 大模型回答,大模型使用基礎能力并結合檢索信息完成對用戶問題的回答。
基于Hippo構建知識庫的演示Demo
了解更多信息,請訪問星環科技向量數據庫Transwarp Hippo官網或星環開發者社區。