(ChinaZ.com) 12 月 7 日消息:谷歌在當(dāng)?shù)貢r間周三宣布推出其認(rèn)為是迄今為止規(guī)模最大、能力最強(qiáng)的人工智能模型 Gemini,以回應(yīng)公司如何盈利化 AI 的迫切問題。
這個大型語言模型 Gemini 包括三種不同規(guī)模的套件:最大、最強(qiáng)大的 Gemini Ultra;適用于廣泛任務(wù)的 Gemini Pro;以及專用于特定任務(wù)和移動設(shè)備的 Gemini Nano。
目前,該公司計(jì)劃通過谷歌云將 Gemini 授權(quán)給客戶,供他們在自己的應(yīng)用程序中使用。從 12 月 13 日起,開發(fā)者和企業(yè)客戶可以通過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 訪問 Gemini Pro。安卓開發(fā)者也將能夠使用 Gemini Nano 進(jìn)行構(gòu)建。Gemini 還將用于驅(qū)動谷歌產(chǎn)品,如其 Bard 聊天機(jī)器人和嘗試以對話式文本回答搜索查詢的搜索生成體驗(yàn)(SGE),后者尚未廣泛推出。
公司和企業(yè)可以使用 Gemini 進(jìn)行更先進(jìn)的客戶服務(wù)互動,如聊天機(jī)器人和產(chǎn)品推薦,以及識別公司想要宣傳產(chǎn)品的趨勢。Gemini 還可以用于內(nèi)容創(chuàng)作,如果公司想要創(chuàng)建營銷活動或博客內(nèi)容,以及希望總結(jié)會議或?yàn)殚_發(fā)者生成代碼的生產(chǎn)力應(yīng)用程序。
該公司給出的例子包括讓 Gemini 獲取圖表的截圖,并分析數(shù)百頁研究,然后更新該圖表。另一個例子是分析一個人的數(shù)學(xué)家庭作業(yè)照片,并識別正確答案和指出錯誤答案。
Gemini Ultra 是首個在 MMLU(大規(guī)模多任務(wù)語言理解)上勝過人類專家的模型,MMLU 使用 57 個科目的組合,如數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理,測試世界知識和解決問題的能力。據(jù)該公司在周三的博客文章中表示,它能夠理解復(fù)雜主題中的細(xì)微差別和推理。
「Gemini 是谷歌團(tuán)隊(duì)間大規(guī)模合作努力的結(jié)果,包括我們在谷歌研究的同事,」皮查伊在周三的博客文章中寫道。「它從頭開始構(gòu)建,是多模態(tài)的,這意味著它可以泛化,并無縫理解、操作和結(jié)合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。」
從今天開始,谷歌的聊天機(jī)器人 Bard 將使用 Gemini Pro 來幫助進(jìn)行高級推理、計(jì)劃、理解和其他能力。明年初,它將推出使用 Gemini Ultra 的「Bard Advanced」,這將是 Bard 更新的最大一次,它類似于 OpenAI 的 ChatGPT 聊天機(jī)器人。
這次更新是在谷歌首次推出 Bard 和 OpenAI 在 GPT-3.5 上推出 ChatGPT 一年后進(jìn)行的。今年 3 月,由 Sam Altman 領(lǐng)導(dǎo)的初創(chuàng)公司推出了 GPT-4。高管們周二表示,Gemini Pro 在性能上超過了 GPT-3.5,但對于與 GPT-4 的比較避而不談。
然而,據(jù)谷歌周三發(fā)布的一份白皮書顯示,Gemini 的 Ultra 模型在一些基準(zhǔn)測試中超過了 GPT-4。
當(dāng)被問及谷歌是否計(jì)劃對「Bard Advanced」的訪問收費(fèi)時,谷歌 Bard 的總經(jīng)理 Sissie Hsiao 表示,公司專注于創(chuàng)造良好的體驗(yàn),目前還沒有任何盈利細(xì)節(jié)。
在新聞發(fā)布會上,當(dāng)被問及 Gemini 與當(dāng)前一代 LLM 相比是否有任何新穎功能時,谷歌 DeepMind 的產(chǎn)品副總裁 Eli Collins 回答說:「我懷疑它確實(shí)有」,但他們?nèi)栽谂α私?Gemini Ultra 的新穎功能。
據(jù)報(bào)道,谷歌推遲了 Gemini 的發(fā)布,因?yàn)樗€沒準(zhǔn)備好,這讓人回想起該公司年初推出其 AI 工具時的混亂局面。
多名記者詢問了關(guān)于延遲的問題,對此 Collins 回答說,測試更先進(jìn)的模型需要更長的時間。Collins 表示,Gemini 是該公司構(gòu)建的經(jīng)過最嚴(yán)格測試的 AI 模型,并且是谷歌任何模型中「最全面的安全評估」。
Collins 說,盡管 Gemini Ultra 是其最大的模型,但提供服務(wù)的成本顯著降低。他說:「它不僅能力更強(qiáng),而且更高效。我們?nèi)匀恍枰罅坑?jì)算來訓(xùn)練 Gemini,但我們在訓(xùn)練這些模型方面變得更加高效。」
Collins 表示,該公司將在周三發(fā)布一份關(guān)于該模型的技術(shù)白皮書,但他表示不會公布參數(shù)數(shù)量。今年早些時候,CNBC 發(fā)現(xiàn)谷歌的 PaLM 2 大型語言模型,當(dāng)時的最新 AI 模型,其訓(xùn)練用的文本數(shù)據(jù)量是前一代 LLM 的近五倍。
同樣在周三,谷歌還推出了其下一代用于訓(xùn)練 AI 模型的張量處理單元。Salesforce 和初創(chuàng)公司 Lightricks 已開始使用的 TPU v5p 芯片,其性能價(jià)格比優(yōu)于 2021 年宣布的 TPU v4,但谷歌沒有提供與市場領(lǐng)導(dǎo)者 Nvidia 相比的性能信息。
這一芯片發(fā)布是在云計(jì)算競爭對手亞馬遜和微軟展示針對 AI 的定制芯片幾周后進(jìn)行的。
在 10 月的谷歌第三季度財(cái)報(bào)電話會議上,投資者向高管們提出了更多關(guān)于谷歌如何將 AI 轉(zhuǎn)化為實(shí)際利潤的問題。
今年 8 月,谷歌推出了一個名為「搜索生成體驗(yàn)」(SGE)的「早期實(shí)驗(yàn)」,該實(shí)驗(yàn)讓用戶看到在使用搜索引擎時生成式 AI 體驗(yàn)是什么樣的——搜索仍然是該公司的主要盈利中心。其結(jié)果更具對話性,反映了聊天機(jī)器人時代的特點(diǎn)。然而,它仍被視為實(shí)驗(yàn),并尚未向公眾推出。
自從 5 月公司在其年度開發(fā)者大會 Google I/O 上首次宣布該實(shí)驗(yàn)以來,投資者一直在詢問 SGE 的時間表。Gemini 周三的公告幾乎沒有提及 SGE,高管們對其向公眾推出的計(jì)劃含糊其辭,稱 Gemini 將「在明年」并入其中。
皮查伊在周三的博客文章中表示:「這個模型驅(qū)動的新時代代表了我們作為一家公司所做出的最大的科學(xué)和工程努力之一。」「我對未來以及 Gemini 將為世界各地的人們帶來的機(jī)會感到由衷的興奮。」