谷歌旗下的基于人工智能的聊天機器人 Bard 在執行邏輯和推理任務方面能力逐漸改進。這是根據谷歌今天發布的一篇博文所述,該博文表明,通過一種名為「隱式代碼執行」的技術,Bard 在數學和編碼等領域有了顯著改進。
正如博文所解釋的那樣,Bard 等大型語言模型(LLM)本質上是預測引擎。當給出一個提示時,它們通過預測下一個句子中可能出現的單詞來生成回答。這使得它們在撰寫電子郵件和文章方面非常出色,但在軟件開發方面卻有些容易出錯。
但是,你可能會問,GitHub 的 Copilot 和亞馬遜的 CodeWhisperer 之類的生成代碼模型呢?這些并非通用型。與 Bard 和 ChatGPT 等競爭對手不同,后者使用了來自網絡、電子書和其他資源的廣泛文本樣本進行訓練,Copilot、CodeWhisperer 和類似的生成代碼模型幾乎完全是在代碼樣本上進行訓練和調優的。
為了解決通用型語言模型在編碼和數學方面的不足,谷歌開發了隱式代碼執行,使 Bard 能夠編寫和執行自己的代碼。最新版本的 Bard 會識別可能受益于邏輯代碼的提示,并在「幕后」編寫代碼、進行測試,并使用結果生成看似更準確的回答。
根據內部基準測試,谷歌表示,與之前版本相比,新版 Bard 對「基于計算的」詞語和數學問題的回答提升了 30%。當然,我們還需要看這些聲明是否經得起外部測試的考驗。
「盡管有了這些改進,Bard 并不總能做到完全正確,例如,Bard 可能不會生成幫助回答的代碼,它生成的代碼可能是錯誤的,或者 Bard 可能不會在回答中包含執行的代碼,」Bard 產品負責人 Jack Krawczyk 和工程副總裁 Amarnag Subramanya 在博文中寫道。「盡管如此,這種改進的能力以結構化、邏輯驅動的方式回應是使 Bard 變得更有幫助的重要一步。」
當谷歌今年早些時候推出 Bard 時,與 Bing Chat 和 ChatGPT 等相比,它并沒有表現得那么出色。事實上,推出過程出現了一些問題,谷歌的一則廣告中 Bard 給出了一個錯誤的答案,導致該公司股價短暫地下跌了 8%。
為了改善這些問題,谷歌引入了隱式代碼生成等其他改進措施,并增加了對新語言、多模式查詢和圖像生成的支持。然而,要想在該領域與領先的生成式人工智能聊天機器人保持競爭力,谷歌還需要進一步努力。
最近,Anthropic 推出了一款具有大幅擴展「上下文窗口」的人工智能聊天機器人模型,使其能夠相對連貫地進行長時間的對話。而開發 ChatGPT 的 OpenAI 公司也開始支持插件,為 ChatGPT 增添外部知識和技能。
來源:站長之家