2 月 18 日消息,微軟表示,在必應聊天機器人多次失控幾天后,公司將對其人工智能聊天機器人實施一些對話限制。
在發現必應存在侮辱用戶、欺騙用戶,甚至操縱用戶情感等行為之后,微軟決定將其其聊天回復限制在每天 50 個問題、每個問題 5 條回復以內。
“我們的數據表明,絕大多數人都能在 5 次回復內找到他們想要的答案,只有大約 1% 的聊天對話會產生 50 條以上的消息” 。
據介紹,如果用戶觸發五條回答的限制,Bing 將提示他們開始一個新主題以避免長時間的聊天。
本周早些時候,微軟警告說,這些包含 15 個或更多問題的長時間聊天會話可能會使必應“變得重復或被提示 / 激怒給出不一定有幫助或不符合我們設計的響應。” 微軟認為在五個回合后結束對話意味著“模型不會混淆”。
微軟目前仍在努力改善必應的設計,但目前還不清楚這些限制將持續多久。微軟只表示:“隨著我們不斷獲得反饋,我們將探索擴大聊天會話的上限。”
各位或多或少聽過,科技圈上周掀起了一次關于聊天機器人的小高潮,微軟和谷歌都試圖通過展示早起版本的 AI 搜索來先發制人。微軟更是宣布,該公司的 AI 搜索僅用 48 小時就吸引 100 多萬人注冊。
這種技術可以針對用戶的問題直接給出答案,看起來就像是真人創作的一樣。微軟 CEO 薩提亞?納德拉(Satya Nadella)表示,該技術“或許會掀起知識工作的工業革命”。但對于擔心準確性的人來說,人工智能還有許多不足之處。
在微軟進行演示時,這項嵌入在必應搜索中的類 ChatGPT 技術分析了 Gap 和 Lululemon 的財報。但業內人士將其給出的答案與財報原文對比后卻發現,這款聊天機器人遺漏了一些數據,甚至會杜撰一些內容。
“必應 AI 在演示過程中給出了一些完全錯誤的答案,但卻沒人注意到。”獨立搜索引擎研究員德米特里?布里爾頓(Dmitri Brereton)寫道,“相反,大家都對必應的宣傳歡欣鼓舞。”
布里爾頓發現,除了財務數據上的錯誤外,微軟在演示中針對吸塵器規格和墨西哥旅行計劃的回答可能存在事實性錯誤。布里爾頓最初并不是為了給微軟“挑刺”,他只是在細致對比微軟和谷歌的答案時意外發現了這些問題。
人工智能專家稱這一現象為“幻覺”,也就是說,基于大語言模型生成的工具有杜撰內容的傾向。上周,谷歌推出了一款與之競爭的人工智能工具,演示過程中同樣存在事實性錯誤 —— 但當時的錯誤很快就被人發現。
來源:IT之家