在科技界的年度盛事2024 re:Invent全球大會(huì)上,亞馬遜公司震撼發(fā)布了六大全新大模型,標(biāo)志著其在人工智能領(lǐng)域的又一重大邁進(jìn)。
這些創(chuàng)新模型均基于亞馬遜最新推出的基礎(chǔ)模型Amazon Nova,并整合在Amazon Bedrock平臺(tái)中,為用戶提供全方位的服務(wù)。Amazon Nova系列包括Micro、Lite、Pro和Premier四款基礎(chǔ)模型。其中,Micro專注于純文本生成,每秒能輸出驚人的210個(gè)token;Lite和Pro則作為多模態(tài)模型,分別與OpenAI的GPT-4o mini和GPT-4o相媲美,并在多項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出更優(yōu)性能;而Premier更是專為復(fù)雜推理任務(wù)設(shè)計(jì)的高階多模態(tài)模型。
在大會(huì)演講中,亞馬遜云科技新任CEO馬特·加曼(Matt Garman)指出,大模型領(lǐng)域正以驚人的速度發(fā)展,每周都有新版本、新功能、新模型涌現(xiàn),成本也在不斷變化。盡管市面上模型眾多,但找到完全符合自身需求的完美模型依然是一項(xiàng)挑戰(zhàn)。因此,亞馬遜云科技致力于打造一個(gè)綜合考慮專業(yè)能力、延遲和成本的大模型服務(wù),近兩年在大模型領(lǐng)域的所有動(dòng)作均圍繞這一目標(biāo)展開。
為滿足市場(chǎng)對(duì)大模型的需求,亞馬遜于2023年4月推出了完全托管的Amazon Bedrock服務(wù)。通過API集合,Bedrock提供來自AI21 Labs、Anthropic、Cohere、meta、Mistral AI、Stability AI以及亞馬遜自身等多家公司的多種基礎(chǔ)模型,涵蓋文本生成、圖像生成等多種類型,為開發(fā)者提供了豐富的選擇。據(jù)加曼透露,Amazon Bedrock的使用量在過去一年增長(zhǎng)了近五倍,每天都有數(shù)萬客戶在生產(chǎn)應(yīng)用中使用。
Amazon Bedrock的成功不僅吸引了大量企業(yè)客戶,還吸引了Salesforce、SAP和Workday等獨(dú)立軟件供應(yīng)商(ISV)將其集成到自身系統(tǒng)上,為下游客戶提供生成式AI服務(wù)。亞馬遜還在Bedrock中推出了模型蒸餾功能,幫助企業(yè)進(jìn)一步降低大模型的使用成本。經(jīng)過蒸餾的模型在運(yùn)行速度上能提高500%,成本降低75%,且所有相關(guān)工作均可在Bedrock中一站式完成。
亞馬遜自研的Nova系列模型在平衡專業(yè)能力、成本和延遲等多方面因素的基礎(chǔ)上推出,并與蒸餾功能整合,將大模型的智能“轉(zhuǎn)移”到更小、成本效益更高、延遲更低的模型中。而在2024 re:Invent大會(huì)上發(fā)布的六款模型只是冰山一角,亞馬遜還計(jì)劃在2025年推出語音到語音模型以及多模態(tài)到多模態(tài)模型。
其中,語音到語音模型預(yù)計(jì)于2025年第一季度推出,旨在通過理解自然語言流式語音輸入,解釋語言和非語言信號(hào),提供流暢的類人交互,徹底改變對(duì)話式AI應(yīng)用。而多模態(tài)到多模態(tài)模型則是亞馬遜在大模型領(lǐng)域的一次全新嘗試,能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態(tài)生成輸出,預(yù)計(jì)于2025年中旬推出,將簡(jiǎn)化應(yīng)用開發(fā),使同一模型能夠執(zhí)行多種任務(wù)。
在大會(huì)上,AI初創(chuàng)公司Anthropic的聯(lián)合創(chuàng)始人兼首席計(jì)算官Tom Brown宣布了“雷尼爾計(jì)劃”,該計(jì)劃將使用擁有數(shù)十萬枚亞馬遜自研芯片的算力集群,數(shù)量是Anthropic現(xiàn)有算力集群的五倍以上。作為亞馬遜投資的AI初創(chuàng)公司,Anthropic已使用亞馬遜AWS的云計(jì)算服務(wù),其Claude系列模型也已集成在Amazon Bedrock上。此舉不僅提升了Anthropic的算力規(guī)模,也展示了亞馬遜云在大模型領(lǐng)域的更大野心。
亞馬遜云科技聯(lián)合Anthropic對(duì)標(biāo)微軟+OpenAI的模式,爭(zhēng)奪更多有大模型和云計(jì)算需求的客戶。此前,微軟CEO薩提亞·納德拉曾表示,超過1.8萬家公司正在使用微軟的Azure OpenAI服務(wù),其中不少是Azure的新客戶,且Azure的收入增長(zhǎng)部分來自GPT-4入口。亞馬遜希望復(fù)制這一成功模式,通過投資將自研芯片與Anthropic深度綁定,降低算力成本,減少對(duì)英偉達(dá)、英特爾等芯片供應(yīng)商的依賴,從而在價(jià)格和服務(wù)上提升競(jìng)爭(zhēng)力。
據(jù)最新數(shù)據(jù)顯示,2024年第三季度,亞馬遜在全球云基礎(chǔ)設(shè)施市場(chǎng)的份額達(dá)到31%,領(lǐng)先于微軟的Azure平臺(tái)和谷歌云。