近日,全球知名IT市場研究與咨詢公司IDC發布了一項關于中國生成式AI應用開發平臺市場的報告,該報告聚焦于企業統一AI開發平臺的雛形,并對市場上的大模型平臺進行了深入探討。IDC定義的大模型平臺由模型開發平臺和應用開發平臺兩部分組成,前者提供訓練與調優工具,后者則支持低代碼/無代碼應用開發。
報告不僅對比分析了市場上的主流大模型平臺廠商,還為企業用戶提供了選擇平臺的關鍵技術指標。在評估中,百度智能云脫穎而出,榮獲七項滿分,穩居榜首,亞馬遜云AWS和阿里云緊隨其后,并列第二。
IDC指出,大模型平臺為應用程序開發開辟了新的路徑。企業在選擇平臺時,應重點關注模型層和數據層的能力。模型層方面,如何讓模型更好地適配企業應用場景是關鍵;數據層方面,則需做好RAG(檢索增強生成),以確保生成內容的準確性,消除幻覺。
百度智能云憑借其深厚的技術積累,在模型層和數據層均表現出色。其千帆大模型平臺提供從模型開發、模型服務到應用開發的全流程服務。文心大模型日均調用量超過15億次,千帆平臺已幫助客戶精調3.3萬個模型,開發77萬個企業應用。
模型精調對于大模型與產業的深度融合至關重要。大模型雖具有強大的泛化能力,但在特定行業及領域的應用中,仍需通過精調來融入專業知識和數據特征,以滿足特定需求。百度智能云千帆平臺提供了完整的工具鏈,支持多種模型訓練方法,并提供高質量通用語料數據和模型精調樣板間,每天超過一半的調用量來自精調后的模型。
以醫療行業為例,杭州全診醫學基于千帆平臺和文心大模型打造的AI醫療助理應用,能夠在醫療全階段服務醫生和患者。通過20萬份精標病歷數據對模型進行精調,AI醫療助理的醫學用語更加準確規范,病歷生成準確度提升45%,醫生接診量提高20%。
RAG技術已成為企業解決大模型幻覺問題的有效手段。生成式AI已成為企業布局和投資的重點,但通用大語言模型在實際應用中常存在幻覺問題或回答不準確的情況。為解決這一問題,企業采用RAG技術,將生成式AI與企業內部數據庫、知識庫結合,使生成內容更加準確合理。IDC發布的另一份報告顯示,在生成式AI開發過程中,41%的高管認為構建RAG架構至關重要,81%的IT領導者認為基于業務數據的生成式AI模型能為企業帶來顯著競爭優勢。
在RAG和向量數據庫市場評估中,百度智能云的向量數據庫VectorDB在核心性能、功能全面性、大模型支持、戰略與生態合作、工程化落地五個領域保持領先,綜合排名并列第一。目前,VectorDB已在超過500家客戶中實際落地使用,支持多種常用算法和主流LLM、RAG框架,以及百度智能云千帆和開源Embedding模型。