日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

編輯:澤南、杜偉、陳萍

又不求融資,怎么也給 demo 加美顏?

「谷歌,這就有點(diǎn)尷尬了。」

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

沒有想到,Gemini 上線頭一天,熱門評(píng)論會(huì)是這個(gè)樣子。

本周三,谷歌的 Gemini 讓生成式 AI 進(jìn)入了原生多模態(tài)時(shí)代。人們第一時(shí)間涌入新模型加持的 Bard 想要試試 AI 的能力,結(jié)果給出的評(píng)價(jià)褒貶不一。

其中最值得注意的是有人指出,Gemini 在發(fā)布時(shí),谷歌給出的一系列 Demo 中最令人眼花繚亂的部分是偽造的。

名為《Hands-on with Gemini: Interacting with multimodal AI》的視頻現(xiàn)在的播放量已經(jīng)有 140 萬(wàn)次,其中展示了谷歌認(rèn)為自己「最喜歡的與 Gemini 的交互案例」,展示了多模態(tài)模型(即它理解并混合語(yǔ)言和視覺理解)如何靈活地響應(yīng)各種輸入。

谷歌展示了 Gemini 神奇的理解和交互能力,人用畫筆繪制一只鴨子的草圖,從一條曲線到一幅完整的圖畫,AI 評(píng)論說(shuō)藍(lán)色是一種不切實(shí)際的動(dòng)物顏色。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

然后 AI 看到一只實(shí)體的玩具藍(lán)色鴨時(shí)表現(xiàn)出了驚訝。然后它會(huì)響應(yīng)人類圍繞鴨子的各種問(wèn)題,包括地球的哪個(gè)地點(diǎn)會(huì)有鴨子,鴨子在各種語(yǔ)言里的讀法等等。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

隨后演示繼續(xù)進(jìn)行,AI 實(shí)現(xiàn)了在換杯子游戲中正確跟蹤、識(shí)別皮影手勢(shì)、識(shí)別材料給出組合建議、重新排序行星草圖等等。

但點(diǎn)擊 YouTube 上的視頻描述,可以發(fā)現(xiàn) google 有一個(gè)重要的免責(zé)聲明:「為了演示的目的,他們已經(jīng)減少延遲,為了簡(jiǎn)潔,Gemini 的輸出也縮短了。」

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

根據(jù)彭博社消息,谷歌在被要求發(fā)表評(píng)論時(shí)承認(rèn),視頻演示并不是實(shí)時(shí)的,而是使用了原始鏡頭中的靜止圖像幀,然后編寫了文本提示,讓 Gemini 做出回應(yīng)。

視頻看起來(lái)很美好,然而,卻也反映出了這一問(wèn)題:視頻不是真實(shí)的。人們使用了各種方式來(lái)進(jìn)行驗(yàn)證,包括使用視頻的截圖來(lái)問(wèn) Bard 中的 Gemini,發(fā)現(xiàn) AI 并不能準(zhǔn)確地回答問(wèn)題。

有理由懷疑,谷歌可能只是制作了一個(gè)夸張的視頻,然后使用靜態(tài)圖像幀和文本進(jìn)行拼湊來(lái)作為 Gemini 的提示語(yǔ)。也就是說(shuō),視頻 Demo 是精心挑選的結(jié)果。

也許 Gemini 可以如實(shí)的完成視頻展示的內(nèi)容,但谷歌沒有這樣做,而是加了速;又或許 Gemini 根本不像視頻中展示的那樣絲滑,有人從好幾個(gè)錯(cuò)誤結(jié)果中挑出了正確的作為素材。

但無(wú)論如何,Gemini 的演示看起來(lái)都像是經(jīng)過(guò)精心調(diào)整好的,對(duì)實(shí)際交互情況進(jìn)行了歪曲。

谷歌在這篇名為《How it’s Made: Interacting with Gemini through multimodal prompting》的博客中也解釋了多模態(tài)交互過(guò)程,即如何通過(guò)多模態(tài) prompting 來(lái)與 Gemini 交互。

注:Gemini 的提示語(yǔ)可以是多模態(tài) prompting(即不同模態(tài)的組合,如圖像和文本),之后讓 Gemini 預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么,從而做出反應(yīng)。

例如,在玩剪刀石頭布的游戲中,谷歌的實(shí)驗(yàn)過(guò)程是這樣的:將照片展示給 Gemini,并要求 Gemini 描述所看到的內(nèi)容:

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

在演示中,一方面,Gemini 似乎確實(shí)產(chǎn)生了視頻中所示的反應(yīng)。但在另一方面,觀眾可能被誤導(dǎo)了,主要體現(xiàn)在與模型的交互速度、準(zhǔn)確性等方面。

例如,在視頻的 2:45 處,一只手靜靜地做出一系列手勢(shì)。Gemini 很快回應(yīng):「我知道你在做什么!你在玩石頭、剪刀、布!」

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

然而在谷歌博客中,用戶必須同時(shí)顯示所有三個(gè)手勢(shì)并提示:你認(rèn)為我在做什么?外加提示:這是一個(gè)游戲。Gemini 才回答道:「你在玩石頭、剪刀、布。」就像下圖所展示的,當(dāng)用戶伸出兩根手指時(shí),Gemini 并不知道這是石頭、剪刀、布的游戲。只有三張圖片都齊全了,Gemini 才能猜對(duì)。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

比較視頻和博客介紹的推理過(guò)程,給人一種完全不同的交互方式,視頻中顯示的「互動(dòng)」過(guò)程并沒有發(fā)生。

在隨后的演示中,將三張帶有太陽(yáng)、土星和地球涂鴉的草圖展示給 Gemini。在視頻中,用戶問(wèn)道「這個(gè)順序正確嗎?」Gemini 回答:「不,是太陽(yáng)、地球、土星。」注意,原視頻中用戶除了「這個(gè)順序正確嗎?」這句話,沒有其他信息。Gemini 卻給出了答案。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

但在實(shí)際的提示中(還是書面的),提示語(yǔ)卻是「這個(gè)順序?qū)幔靠紤]到與太陽(yáng)的距離,并解釋你的理由。」Gemini 回答:正確的順序是太陽(yáng)、地球、土星。太陽(yáng)離太陽(yáng)系中心最近,其次是地球,然后是土星。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

我們可以推測(cè),在視頻中,Gemini 的回答可能需要其他幫助,只是谷歌沒有體現(xiàn)出來(lái)。

在視頻展示的另一個(gè)示例中,紙團(tuán)在杯子之間交換,視頻中,Gemini 立即且看似直觀地進(jìn)行檢測(cè)和跟蹤。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

但在博客中,完成這一過(guò)程還是很復(fù)雜的。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

每動(dòng)一次都要和大模型交流一下。也許我們應(yīng)該假設(shè)谷歌人工智能演示中的所有功能都被夸大了。

面對(duì)人們的質(zhì)疑,谷歌的回應(yīng)是:他們直接承認(rèn)了。

在本文發(fā)表后發(fā)布的社交媒體帖子中,Google DeepMind 的研究副總裁 Oriol Vinyals 詳細(xì)介紹了「錄制該視頻時(shí) Gemini 是如何使用的」。

Oriol Vinyals 表示,谷歌為 Gemini 提供的多模態(tài)能力和即時(shí)響應(yīng)將在 12 月 13 日開放 Pro 訪問(wèn)權(quán)限時(shí)供開發(fā)者使用。不過(guò) Demo 視頻里的內(nèi)容是使用 Ultra 模型做到的。視頻中的所有人類提示和 AI 輸出都是真實(shí)的,但為簡(jiǎn)潔起見進(jìn)行了縮短。

谷歌 Gemini 聯(lián)合負(fù)責(zé)人 Oriol Vinyals 的推特:

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

圖源:https://x.com/OriolVinyalsML/status/1732885990291775553?s=20

對(duì)此網(wǎng)友們并不買賬:你說(shuō)它是真的,又說(shuō)不是真實(shí)的大模型推理速度,這不是自相矛盾嗎?

Gemini 遭自家員工指責(zé),Pro 版本打不過(guò) GPT-3.5

彭博社等媒體指出,在谷歌宣傳其 demo 視頻的同時(shí),又遭到了一些自家員工的非議。尤其是在畫鴨子時(shí),Gemini 似乎能夠在繪制時(shí)進(jìn)行實(shí)時(shí)分析,并在與用戶對(duì)話時(shí)以人聲回應(yīng)。

谷歌 CEO 皮查伊極力推廣這段 demo,并表示了解 Gemini 潛在驚人能力的最好方式是看它的實(shí)際效果。看客們也對(duì) demo 贊賞有加,直呼令人興奮和不真實(shí)(unreal)。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

圖源:https://Twitter.com/sundarpichai/status/1732433036929589301

不過(guò)很快有人指出,Gemini 并不像想象中那么好,你無(wú)法指望它像 demo 中那樣地靈敏智能。一些谷歌內(nèi)部員工指出了其中的「貓膩」。

一位員工向彭博社透露稱,這段 demo 描述了一副不切實(shí)際的畫面,過(guò)分渲染了從 Gemini 中輸出驚艷的效果是如此得容易。

另一位員工則表示,他們對(duì) demo 并不感到驚訝, 并且已經(jīng)習(xí)慣了公司在定位自身產(chǎn)品時(shí)存在某種程度的營(yíng)銷炒作。當(dāng)然,所有公司都會(huì)這樣做。因此他認(rèn)為,大多數(shù)使用過(guò)任何 LLM 技術(shù)的員工都知道要對(duì) demo 持保留態(tài)度。

對(duì)此,谷歌 DeepMind 產(chǎn)品副總裁 Eli Collins 告訴彭博社稱,鴨子繪圖演示仍然是研究層面的功能,正在開發(fā)當(dāng)中,而并不是實(shí)際的產(chǎn)品,至少目前是這樣。

對(duì)此,還有一些谷歌員工一直在討論,在沒有明確透露實(shí)情的情況下展示視頻是否會(huì)誤導(dǎo)公眾。甚至有人分享了一個(gè)模因,暗示鴨子視頻經(jīng)過(guò)了欺騙性編輯。「我猜視頻創(chuàng)建者更看重『講故事』的能力。」

除了 demo 視頻遭到公眾和內(nèi)部員工質(zhì)疑之外,Gemini 真如宣稱的那樣強(qiáng)大嗎?我們知道,Gemini 此次有三個(gè)版本,能力最強(qiáng)的 Gemini Ultra、多任務(wù)的 Gemini Pro、以及特定任務(wù)和端側(cè)的 Gemini Nano。

目前,谷歌類 ChatGPT 應(yīng)用 Bard 可免費(fèi)升級(jí)到 Gemini Pro 版本,Gemini Ultra 預(yù)計(jì)于明年初通過(guò) Bard Advanced 與用戶見面。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

在與 GPT-4 的比較中,谷歌給出的數(shù)據(jù)是 Gemini Ultra 全面超越 GPT-4,Pro 在大多數(shù)指標(biāo)上超越 GPT-3.5。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

但實(shí)際效果究竟如何呢?推特用戶 Brett Winton 首次對(duì) Gemini Pro、Claude 和 GPT-3.5 進(jìn)行了基準(zhǔn)測(cè)試,對(duì)每個(gè)模型提了一道 8 年級(jí)的故事題。他得出的結(jié)論是:GPT-3.5 滿分、Claude 約 67 分,Gemini Pro 完全沒有那個(gè)味。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

圖源:https://twitter.com/wintonARK/status/1732527909376815419

三個(gè)模型給出的答案分別如下:

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

從左到右依次為 Bard(Gemini Pro)、Claude 和 GPT-3.5。

看到這一結(jié)果,似乎只能用「升級(jí)了,但還沒完全升級(jí)」來(lái)做解釋。他表示在 Gemini Ultra 最終上線之前,還是不對(duì)它的能力做評(píng)價(jià)了。

Gemini 開創(chuàng)了新架構(gòu),引來(lái)了流量,也遭受了批評(píng),那么現(xiàn)在看來(lái),谷歌反攻微軟的大計(jì)成了沒成?

至少?gòu)耐顿Y者們來(lái)看是個(gè)好的開頭。

本周四,谷歌的股價(jià)經(jīng)歷了暴漲,市值增加了 800 億美元。需要記得的是,在 2 月份谷歌推出 Bard 時(shí),谷歌的股價(jià)一天跌去了 1000 億美元。

人們認(rèn)為,Gemini 可以幫助谷歌縮小與微軟、OpenAI 在大模型上的差距。

Gemini上線首日:用戶褒貶不一,演示被質(zhì)疑「造假」,谷歌承認(rèn)了

也許 1.0 版的 Gemini 只是開了個(gè)頭,我們還要保持耐心,等待大模型的進(jìn)一步技術(shù)升級(jí)。

參考內(nèi)容:

https://www.theverge.com/2023/12/7/23992737/google-gemini-misrepresentation-ai-accusation

https://techcrunch.com/2023/12/07/googles-best-gemini-demo-was-faked/

https://www.businessinsider.com/google-gemini-ai-performance-openai-chatgpt-gpt4-2023-12

-https://www.bloomberg.com/news/newsletters/2023-12-07/google-s-demo-for-chatgpt-rival-criticized-by-some-employees?srnd=technology-vp

分享到:
標(biāo)簽:Gemini
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定