財聯(lián)社5月14日訊(編輯 史正丞)北京時間周二凌晨1點,自年初“文生視頻模型” Sora后許久未給市場帶來驚喜的AI target=_blank class=infotextkey>OpenAI舉行春季發(fā)布會。公司首席技術(shù)官Mira Murati向外界展現(xiàn)了多項與ChatGPT有關(guān)的更新。
簡要來說,OpenAI的發(fā)布會主要干了兩件事情:首先是發(fā)布最新GPT-4o多模態(tài)大模型,相較于GPT-4 Trubo速度更快、價格也更便宜。
通過響應(yīng)速度的大幅提升,該模型在語音模式下已經(jīng)可以達到“實時”響應(yīng)的狀態(tài)。用戶可以與ChatGPT像真人一樣聊天——在機器人回應(yīng)的過程中打斷它,提出更多的要求(例如轉(zhuǎn)變話題、要求機器人改變語音語調(diào)),再也不需要等待機器人完成上一個問題的回復(fù)后,再提出新的問題。
山姆·奧爾特曼在博客中表示,AI達到人類級別的響應(yīng)時間和表現(xiàn)力證明是一個很大的改變,這個新東西在感受上是完全不同的。它快速、聰明、有趣、自然且有幫助。
第二件事情就是宣布,ChatGPT的免費用戶也能用上最新發(fā)布的GPT-4o模型(更新前只能使用GPT-3.5),來進行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問應(yīng)用商店等操作。這也意味著GPT應(yīng)用商店的開發(fā)者,將面對海量的新增用戶。
當(dāng)然,付費用戶將會獲得更高的消息限額(OpenAI說至少是5倍)。當(dāng)免費用戶用完消息數(shù)量后,ChatGPT將自動切換到 GPT-3.5。另外,OpenAI將在未來1個月左右向Plus用戶推出基于GPT-4o改進的語音體驗,目前GPT-4o的API并不包含語音功能。
最后,蘋果電腦用戶將迎來一款為macOS設(shè)計的ChatGPT桌面應(yīng)用,用戶可以通過快捷鍵“拍攝”桌面并向ChatGP提問,OpenAI表示,windows版本將在今年晚些時候推出。
----發(fā)布會全程回顧----
01點00分:倒計時結(jié)束,直播正式開始。首席技術(shù)官Mira Murati登場。
01點01分:Mira Murati表示,今天她將談?wù)?件事情:1)為什么一個可以免費、廣泛使用的工具對于OpenAI非常重要?2)如何減少摩擦,讓每個人都能使用ChatGPT,公司將發(fā)布桌面版的ChatGPT;3)公司將在今日發(fā)布最新的旗艦大模型,叫做GPT-4o。
這里的“o”指的是“全方位”(omni)的意思——指的是GPT-4o的多模態(tài)特性。
01點05分:對于桌面版的ChatGPT,OpenAI表示重新對UI進行了設(shè)計。(注:OpenAI在公告中表示,桌面應(yīng)用程序適用于macOS,Windows版本將在今年晚些時候推出)
01點08分:GPT-4o具備GPT-4同等的智能,但運行速度更快,兼具文字、音頻和視頻能力。這是OpenAI歷史上第一次在“便于使用”這個目標上實現(xiàn)了飛躍的進步。
01點13分:直到今天之前,在語音模式下,OpenAI仍需要調(diào)用三個模型——轉(zhuǎn)寫、智能和文生語音功能,這也造成了體驗上的巨大延遲。而GPT-4o可以自然地在圖片、文字和聲音上進行推理。
01點17分:通過效率的提升,也使得OpenAI可以向免費用戶提供GPT-4級別的智能。
01點19分:Murati重申,由于GPT-4o帶來的效率提升,現(xiàn)在OpenAI可以讓所有人都能使用上(GPT-4)工具。
01點20分:目前GPT Store里已經(jīng)有超過100萬個GPTs。伴隨著免費開放,GPTs的開發(fā)者將獲得更大的用戶基數(shù)。
01點22分:免費用戶也將能夠上傳圖片、進行分析、使用“瀏覽器”功能搜索實時信息。同時GPT-4o也將支持記憶功能。GPT-4o也將支持API,供開發(fā)者調(diào)用。相較于GPT-4 Turbo,GPT-4o快兩倍、便宜50%,速率限制高出5倍。
01點25分:兩名研究主管Mark Chen和Barret Zoph登臺,他們將演示一系列新功能。
01點26分:Mark Chen正在與ChatGPT寒暄,機器人能夠從急促的喘氣聲中理解“緊張”的含義,并且指導(dǎo)他進行深呼吸。
01點28分:Chen表示,他的演示是為了說明,在目前的語音模式下,不需要再與機器進行機械的一問一答,可以進行實時的溝通交流。實時交流中不需要再每次“尷尬地等待2-3秒”。
01點30分:實時演示中,主持們不斷要求ChatGPT變換語調(diào),包括夸張的語氣、機器人的預(yù)期和使用“唱腔”講故事。
01點35分:Barret Zoph啟動攝像頭,要求ChatGPT實時幫助他解決一個一元方程題。
01點37分:除了圖像識別和解題能力外,ChatGPT展現(xiàn)了實時根據(jù)影像變化,與Barret實時互動的能力。
01點40分:Barret進一步展示了ChatGPT桌面版對代碼和電腦桌面(一張氣溫圖表)進行實時解讀的能力。
01點42分:Murati和Mark Chen展示ChatGPT進行意大利語、英語的實時交傳翻譯。
發(fā)布會結(jié)束,OpenAI表示今天的發(fā)布會主要聚焦于免費用戶,這些功能將在未來幾周內(nèi)逐步向所有用戶推送。
根據(jù)OpenAI的官網(wǎng)公告顯示,GPT-4o將同時向付費的Plus、Team用戶,以及免費用戶推出。Plus用戶的消息限制數(shù)量將是免費用戶的5倍,Team和Enterprise用戶的可用消息數(shù)量還會更高一些。當(dāng)免費用戶的使用量達到限制后,ChatGPT將自動切換到GPT-3.5,以便繼續(xù)進行對話。