在科技界的矚目下,亞馬遜于近日在其年度re:invent大會(huì)上,由現(xiàn)任公司首席執(zhí)行官安迪·賈西親自揭曉了生成式AI領(lǐng)域的最新力作——Amazon Nova系列基礎(chǔ)模型。這一發(fā)布不僅標(biāo)志著亞馬遜在大型語言模型技術(shù)上的又一重大突破,也展示了其在多模態(tài)AI應(yīng)用方面的雄心壯志。
去年,亞馬遜以Titan模型初涉大模型領(lǐng)域,彼時(shí)其能力尚局限于單一語言模態(tài)。而今,Nova系列的問世,無疑是亞馬遜在該領(lǐng)域深度探索與全面布局的體現(xiàn)。Nova系列主打“Any to Any”理念,即任意模態(tài)輸入、任意模態(tài)輸出,無論是文本生成文本、文本生成圖像,還是圖像生成視頻,Nova都能游刃有余。在Benchmark評(píng)測中,Nova系列模型更是展現(xiàn)出了SOTA級(jí)別的實(shí)力,幾乎擊敗了所有同量級(jí)和市場定位的基礎(chǔ)模型。
面對(duì)這一王炸級(jí)別的自研產(chǎn)品,人們不禁好奇,亞馬遜如何看待與模型生態(tài)伙伴的關(guān)系?對(duì)此,安迪·賈西在發(fā)布會(huì)上給出了他的見解。他表示,亞馬遜內(nèi)部構(gòu)建的AI應(yīng)用中,模型使用的多樣性令人印象深刻。開發(fā)者們同樣追求低延遲、低成本、微調(diào)能力、知識(shí)庫協(xié)調(diào)以及自動(dòng)化操作等多元化需求。因此,亞馬遜云科技的模型策略,就是賦予開發(fā)者盡可能多的自主選擇權(quán)。
“我們深知,沒有一種工具能在所有領(lǐng)域一統(tǒng)天下。”賈西舉例道,數(shù)據(jù)庫領(lǐng)域有關(guān)系型和非關(guān)系型之分,AI框架領(lǐng)域也曾有TensorFlow與PyTorch之爭。模型領(lǐng)域同樣如此,多樣性是不可避免的趨勢。
在Nova系列中,亞馬遜推出了六種大模型,包括四種文本生成模型和兩種視覺內(nèi)容生成模型。其中,Micro模型以其輕量級(jí)、高響應(yīng)速度和高性價(jià)比,成為了內(nèi)部開發(fā)者處理簡單任務(wù)的首選。Lite、Pro和Premier模型則分別在不同性能需求下,提供了多模態(tài)輸入與文本輸出的解決方案。特別是Premier模型,其對(duì)標(biāo)的是OpenAI的Orion系列,旨在應(yīng)對(duì)復(fù)雜推理任務(wù),并成為定制模型蒸餾的“教師”。
除了性能卓越,Nova系列模型還具備成本效益高、速度快等優(yōu)勢。與Amazon Bedrock中的其他模型相比,Nova系列能節(jié)省約75%的成本。同時(shí),它們已與Bedrock的所有功能深度整合,開發(fā)者可以對(duì)模型進(jìn)行微調(diào)、增強(qiáng)或蒸餾,以滿足各種應(yīng)用需求。
在視覺內(nèi)容生成方面,Amazon Nova Canvas和Reel模型同樣引人注目。Canvas可以根據(jù)文本或圖像提示生成專業(yè)級(jí)圖像,并支持文本編輯、配色方案和布局控制等功能。在第三方對(duì)比評(píng)估中,Canvas的表現(xiàn)優(yōu)于OpenAI DALL-E 3和Stable Diffusion。而Reel則是一款先進(jìn)的視頻生成模型,可輕松創(chuàng)建高質(zhì)量視頻,適用于廣告、營銷和培訓(xùn)內(nèi)容創(chuàng)作。未來幾個(gè)月內(nèi),Reel將支持生成最長2分鐘的視頻。
安迪·賈西還透露了Nova系列的后續(xù)計(jì)劃,包括明年推出第二代模型、第一季度推出語音到語音模型以及年中推出多模態(tài)輸入到多模態(tài)輸出的模型。這一系列動(dòng)作無疑將進(jìn)一步鞏固亞馬遜在生成式AI領(lǐng)域的領(lǐng)先地位。
在發(fā)布會(huì)上,賈西還分享了亞馬遜內(nèi)部AI應(yīng)用的多個(gè)案例,包括零售業(yè)務(wù)中的個(gè)性化推薦、履約中心揀貨路徑規(guī)劃、Prime Air無人機(jī)送貨、Amazon Go商店的Just Walk Out技術(shù)以及為Alexa提供技術(shù)支持等。這些應(yīng)用不僅提高了效率和客戶滿意度,還創(chuàng)造了全新的購物體驗(yàn)。
以智能客服為例,亞馬遜利用生成式AI對(duì)聊天機(jī)器人進(jìn)行了重構(gòu),使其能夠更準(zhǔn)確地理解客戶需求,并提供個(gè)性化的解決方案。這一改變使得客戶滿意度提升了500個(gè)基點(diǎn)。同樣地,在庫存管理方面,亞馬遜運(yùn)用Transformer模型提高了長期需求預(yù)測的準(zhǔn)確性,從而節(jié)省了數(shù)以十億美元計(jì)算的成本。
在創(chuàng)新客戶體驗(yàn)方面,亞馬遜也推出了多個(gè)AI應(yīng)用。例如,Rufus購物智能體能夠?yàn)榭蛻籼峁╊愃普嫒藢?dǎo)購的體驗(yàn);Alexa則正在通過多個(gè)基礎(chǔ)模型進(jìn)行重構(gòu),以更好地回答用戶問題并預(yù)測用戶需求;Amazon Lens則利用計(jì)算機(jī)視覺和多模態(tài)模型幫助用戶通過照片搜索并購買商品。
這些應(yīng)用不僅展示了亞馬遜在AI技術(shù)上的深厚積累和創(chuàng)新精神,也為其在全球電商市場的競爭中增添了新的籌碼。隨著Nova系列模型的推出和更多AI應(yīng)用的落地,亞馬遜無疑將在生成式AI領(lǐng)域掀起新的浪潮。