智東西
編譯 | Glu
編輯 | 李水青
智東西6月13日消息,當(dāng)?shù)貢r(shí)間6月7日,科技巨頭谷歌公司對(duì)其AI聊天機(jī)器人Bard進(jìn)行了更新,提升了機(jī)器人邏輯與推理能力,并增加了表格的導(dǎo)出形式。
Bard是谷歌公司為了對(duì)抗ChatGPT和BingChat,在今年3月21日正式推出的一款聊天機(jī)器人。此次更新是谷歌繼5月新增Bard圖片回復(fù)功能后的又一次功能迭代,主要針對(duì)Bard的數(shù)學(xué)計(jì)算能力,預(yù)計(jì)能將Bard解決數(shù)學(xué)問(wèn)題的能力提高30%。
一、結(jié)果的生成:不只靠預(yù)測(cè),加入計(jì)算力
Bard這次的具體更新內(nèi)容包括兩個(gè)方面:
1、提升在數(shù)學(xué)計(jì)算、編碼問(wèn)題和字符串操作方面的能力;
2、提供了一個(gè)“到谷歌表格”的新導(dǎo)出選項(xiàng)。有了這個(gè)新功能,用戶(hù)可以將Bard在其回答中創(chuàng)建的表格直接導(dǎo)出到表格中。
在第一項(xiàng)更新中,Bard使用了一種名為“隱式代碼執(zhí)行(implicit code execution)”的新技術(shù),它可以讓Bard編寫(xiě)和執(zhí)行自己的代碼。最新版本的Bard識(shí)別能根據(jù)邏輯代碼的提示,在后臺(tái)編寫(xiě)代碼、對(duì)其進(jìn)行測(cè)試,并使用結(jié)果來(lái)生成更準(zhǔn)確的回答。
這大大提高了Bard的推理和數(shù)學(xué)能力,使其有能力解決高級(jí)推理和邏輯性較強(qiáng)的復(fù)雜問(wèn)題。如:
- 15683615的質(zhì)因數(shù)是什么?
- 計(jì)算某人儲(chǔ)蓄的增長(zhǎng)率
- 倒寫(xiě)單詞“Lollipop”
▲B(niǎo)ard對(duì)倒寫(xiě)單詞“Lollipop”的回復(fù)
Bard之前所使用的LLM(大語(yǔ)言模型)像是一個(gè)預(yù)測(cè)引擎。LLM根據(jù)提示,來(lái)預(yù)測(cè)可能進(jìn)一步出現(xiàn)的詞匯,進(jìn)而生產(chǎn)回復(fù),整個(gè)流程并不涉及精細(xì)的邏輯推理與計(jì)算。因此,他們有能力解決語(yǔ)言類(lèi)、創(chuàng)造性任務(wù),但卻無(wú)法準(zhǔn)確回答推理、數(shù)學(xué)等領(lǐng)域的問(wèn)題。
二、結(jié)合大模型與傳統(tǒng)代碼,準(zhǔn)確度提高30%
這項(xiàng)技術(shù)的靈感來(lái)源是二分法,特別是丹尼爾·卡尼曼(Daniel Kahneman)的雙系統(tǒng)思維模型,他認(rèn)為人的大腦存在兩個(gè)系統(tǒng),并稱(chēng)之為系統(tǒng)1和系統(tǒng)2:
- 系統(tǒng)1是無(wú)意識(shí)思考,是快速的、直觀(guān)的、毫不費(fèi)力的,如一個(gè)樂(lè)手在演出現(xiàn)場(chǎng)即興演奏,使用的就是系統(tǒng)1思維;
- 系統(tǒng)2則需要耗費(fèi)精力、保持專(zhuān)注,是緩慢的、審慎的,如人們運(yùn)用數(shù)學(xué)運(yùn)算、學(xué)習(xí)專(zhuān)業(yè)樂(lè)器演奏時(shí),使用的是系統(tǒng)2思維。
以此類(lèi)比:
- LLM是在系統(tǒng)1思維下運(yùn)作的——沒(méi)有經(jīng)過(guò)深度思考,快速產(chǎn)生文本;
- 傳統(tǒng)代碼計(jì)算方法則與系統(tǒng)2類(lèi)似——公式化、不靈活,但能產(chǎn)生正確的結(jié)果。
以做一道數(shù)學(xué)題為例,如果只使用系統(tǒng)1,那根本不需要解題方法,直接把想到的答案寫(xiě)出來(lái)就行了;但是加上系統(tǒng)2后,便可以運(yùn)用加減乘除等數(shù)學(xué)方法去解題。
本次更新中,谷歌結(jié)合了LLM(系統(tǒng)1)和傳統(tǒng)代碼(系統(tǒng)2)的能力,來(lái)幫助提高Bard反應(yīng)的準(zhǔn)確性。谷歌稱(chēng),在他們的內(nèi)測(cè)數(shù)據(jù)集中,Bard解決計(jì)算類(lèi)問(wèn)題的準(zhǔn)確性提高了約30%。
即使這樣,Bard也無(wú)法保證回應(yīng)的絕對(duì)準(zhǔn)確。Bard不會(huì)生成有助于提示響應(yīng)的代碼,它生成的代碼可能是錯(cuò)誤的,它也無(wú)法保證一定將執(zhí)行的代碼包括在其響應(yīng)中。
結(jié)語(yǔ):各大廠(chǎng)商關(guān)注機(jī)器人邏輯性,AIGC準(zhǔn)確性將繼續(xù)提高
6月1日,OpenAI宣布ChatGPT數(shù)學(xué)解題能力將大幅提升,現(xiàn)在,谷歌也宣布了Bard的數(shù)學(xué)計(jì)算能力提高了30%。
這向我們釋放了強(qiáng)烈的訊號(hào),即AIGC聊天機(jī)器人行業(yè)陸續(xù)在關(guān)注著AIGC解決復(fù)雜問(wèn)題的能力、生成內(nèi)容的準(zhǔn)確性,并不斷在以各種方式提升AIGC內(nèi)容的結(jié)構(gòu)化、邏輯性。未來(lái),我們將享受到能力更強(qiáng)大、結(jié)果更準(zhǔn)確的AI服務(wù)。
來(lái)源:google官網(wǎng)