智東西
編譯 | Glu
編輯 | 李水青
智東西6月13日消息,當地時間6月7日,科技巨頭谷歌公司對其AI聊天機器人Bard進行了更新,提升了機器人邏輯與推理能力,并增加了表格的導出形式。
Bard是谷歌公司為了對抗ChatGPT和BingChat,在今年3月21日正式推出的一款聊天機器人。此次更新是谷歌繼5月新增Bard圖片回復功能后的又一次功能迭代,主要針對Bard的數學計算能力,預計能將Bard解決數學問題的能力提高30%。
一、結果的生成:不只靠預測,加入計算力
Bard這次的具體更新內容包括兩個方面:
1、提升在數學計算、編碼問題和字符串操作方面的能力;
2、提供了一個“到谷歌表格”的新導出選項。有了這個新功能,用戶可以將Bard在其回答中創建的表格直接導出到表格中。
在第一項更新中,Bard使用了一種名為“隱式代碼執行(implicit code execution)”的新技術,它可以讓Bard編寫和執行自己的代碼。最新版本的Bard識別能根據邏輯代碼的提示,在后臺編寫代碼、對其進行測試,并使用結果來生成更準確的回答。
這大大提高了Bard的推理和數學能力,使其有能力解決高級推理和邏輯性較強的復雜問題。如:
- 15683615的質因數是什么?
- 計算某人儲蓄的增長率
- 倒寫單詞“Lollipop”
▲Bard對倒寫單詞“Lollipop”的回復
Bard之前所使用的LLM(大語言模型)像是一個預測引擎。LLM根據提示,來預測可能進一步出現的詞匯,進而生產回復,整個流程并不涉及精細的邏輯推理與計算。因此,他們有能力解決語言類、創造性任務,但卻無法準確回答推理、數學等領域的問題。
二、結合大模型與傳統代碼,準確度提高30%
這項技術的靈感來源是二分法,特別是丹尼爾·卡尼曼(Daniel Kahneman)的雙系統思維模型,他認為人的大腦存在兩個系統,并稱之為系統1和系統2:
- 系統1是無意識思考,是快速的、直觀的、毫不費力的,如一個樂手在演出現場即興演奏,使用的就是系統1思維;
- 系統2則需要耗費精力、保持專注,是緩慢的、審慎的,如人們運用數學運算、學習專業樂器演奏時,使用的是系統2思維。
以此類比:
- LLM是在系統1思維下運作的——沒有經過深度思考,快速產生文本;
- 傳統代碼計算方法則與系統2類似——公式化、不靈活,但能產生正確的結果。
以做一道數學題為例,如果只使用系統1,那根本不需要解題方法,直接把想到的答案寫出來就行了;但是加上系統2后,便可以運用加減乘除等數學方法去解題。
本次更新中,谷歌結合了LLM(系統1)和傳統代碼(系統2)的能力,來幫助提高Bard反應的準確性。谷歌稱,在他們的內測數據集中,Bard解決計算類問題的準確性提高了約30%。
即使這樣,Bard也無法保證回應的絕對準確。Bard不會生成有助于提示響應的代碼,它生成的代碼可能是錯誤的,它也無法保證一定將執行的代碼包括在其響應中。
結語:各大廠商關注機器人邏輯性,AIGC準確性將繼續提高
6月1日,OpenAI宣布ChatGPT數學解題能力將大幅提升,現在,谷歌也宣布了Bard的數學計算能力提高了30%。
這向我們釋放了強烈的訊號,即AIGC聊天機器人行業陸續在關注著AIGC解決復雜問題的能力、生成內容的準確性,并不斷在以各種方式提升AIGC內容的結構化、邏輯性。未來,我們將享受到能力更強大、結果更準確的AI服務。
來源:google官網