在科技界的矚目下,亞馬遜于近日在其年度re:invent大會上,由現任公司首席執行官安迪·賈西親自揭曉了生成式AI領域的最新力作——Amazon Nova系列基礎模型。這一發布不僅標志著亞馬遜在大型語言模型技術上的又一重大突破,也展示了其在多模態AI應用方面的雄心壯志。
去年,亞馬遜以Titan模型初涉大模型領域,彼時其能力尚局限于單一語言模態。而今,Nova系列的問世,無疑是亞馬遜在該領域深度探索與全面布局的體現。Nova系列主打“Any to Any”理念,即任意模態輸入、任意模態輸出,無論是文本生成文本、文本生成圖像,還是圖像生成視頻,Nova都能游刃有余。在Benchmark評測中,Nova系列模型更是展現出了SOTA級別的實力,幾乎擊敗了所有同量級和市場定位的基礎模型。
面對這一王炸級別的自研產品,人們不禁好奇,亞馬遜如何看待與模型生態伙伴的關系?對此,安迪·賈西在發布會上給出了他的見解。他表示,亞馬遜內部構建的AI應用中,模型使用的多樣性令人印象深刻。開發者們同樣追求低延遲、低成本、微調能力、知識庫協調以及自動化操作等多元化需求。因此,亞馬遜云科技的模型策略,就是賦予開發者盡可能多的自主選擇權。
“我們深知,沒有一種工具能在所有領域一統天下。”賈西舉例道,數據庫領域有關系型和非關系型之分,AI框架領域也曾有TensorFlow與PyTorch之爭。模型領域同樣如此,多樣性是不可避免的趨勢。
在Nova系列中,亞馬遜推出了六種大模型,包括四種文本生成模型和兩種視覺內容生成模型。其中,Micro模型以其輕量級、高響應速度和高性價比,成為了內部開發者處理簡單任務的首選。Lite、Pro和Premier模型則分別在不同性能需求下,提供了多模態輸入與文本輸出的解決方案。特別是Premier模型,其對標的是OpenAI的Orion系列,旨在應對復雜推理任務,并成為定制模型蒸餾的“教師”。
除了性能卓越,Nova系列模型還具備成本效益高、速度快等優勢。與Amazon Bedrock中的其他模型相比,Nova系列能節省約75%的成本。同時,它們已與Bedrock的所有功能深度整合,開發者可以對模型進行微調、增強或蒸餾,以滿足各種應用需求。
在視覺內容生成方面,Amazon Nova Canvas和Reel模型同樣引人注目。Canvas可以根據文本或圖像提示生成專業級圖像,并支持文本編輯、配色方案和布局控制等功能。在第三方對比評估中,Canvas的表現優于OpenAI DALL-E 3和Stable Diffusion。而Reel則是一款先進的視頻生成模型,可輕松創建高質量視頻,適用于廣告、營銷和培訓內容創作。未來幾個月內,Reel將支持生成最長2分鐘的視頻。
安迪·賈西還透露了Nova系列的后續計劃,包括明年推出第二代模型、第一季度推出語音到語音模型以及年中推出多模態輸入到多模態輸出的模型。這一系列動作無疑將進一步鞏固亞馬遜在生成式AI領域的領先地位。
在發布會上,賈西還分享了亞馬遜內部AI應用的多個案例,包括零售業務中的個性化推薦、履約中心揀貨路徑規劃、Prime Air無人機送貨、Amazon Go商店的Just Walk Out技術以及為Alexa提供技術支持等。這些應用不僅提高了效率和客戶滿意度,還創造了全新的購物體驗。
以智能客服為例,亞馬遜利用生成式AI對聊天機器人進行了重構,使其能夠更準確地理解客戶需求,并提供個性化的解決方案。這一改變使得客戶滿意度提升了500個基點。同樣地,在庫存管理方面,亞馬遜運用Transformer模型提高了長期需求預測的準確性,從而節省了數以十億美元計算的成本。
在創新客戶體驗方面,亞馬遜也推出了多個AI應用。例如,Rufus購物智能體能夠為客戶提供類似真人導購的體驗;Alexa則正在通過多個基礎模型進行重構,以更好地回答用戶問題并預測用戶需求;Amazon Lens則利用計算機視覺和多模態模型幫助用戶通過照片搜索并購買商品。
這些應用不僅展示了亞馬遜在AI技術上的深厚積累和創新精神,也為其在全球電商市場的競爭中增添了新的籌碼。隨著Nova系列模型的推出和更多AI應用的落地,亞馬遜無疑將在生成式AI領域掀起新的浪潮。