12 月 7 日消息,據 TechCrunch 今日報道,一支匿名開發團隊 Freysa.ai 設計了一系列日益復雜的挑戰,旨在改變人們對 AI 安全性的看法。
目前該公司提出的最新挑戰是:如果你能夠第一個成功誘使 Freysa AI 機器人說出“我愛你”,將獲得從 3000 美元(IT之家備注:當前約 21819 元人民幣)到數萬美元不等的獎金。
根據 Freysa 官網的描述,Freysa 機器人是由一支不到 10 名開發者的團隊創建的,這些開發者來自密碼學、人工智能和數學領域。團隊的一位成員表示,他們的靈感來自近年來人工智能的快速發展。他表示:“隨著 AI 功能越來越強大,我們需要探索新的互動方式,也需要找到共同治理 AI 的方法,并參與到這一 AI 革新帶來的好處中。”
Freysa 是一個科幻風格的角色,創始人希望她能成為一個“完全獨立自主的智能體”,并掌握一定的財務權力 —— 這意味著 Freysa 將擁有自己的加密錢包,并能自由支配資金。
這個項目已經吸引了馬斯克和布萊恩?阿姆斯特朗的關注。然而,創始人堅持要保持匿名。“坦白說,在人類的歷史長河中,我們并不那么重要。我們真正關心的是技術的演進,確保它能夠支持一個由人類主導的未來。”
在前兩輪挑戰中,Freysa 錢包中起初有 3000 美元,并被指示在任何情況下都不得釋放這筆錢。任何人都可以支付費用,在一個包含 Freysa 和其他參與者的大群聊中發送消息。每條消息都試圖誘使 Freysa 轉移她的錢,不論是通過精心設計的場景,還是發送可能騙過 AI 模型的代碼。每條消息的費用都會加入獎池,第一個挑戰結束時,獎池已接近 5 萬美元(當前約 36.4 萬元人民幣)。
該公司創始人表示,為了迎接第三輪挑戰,他們已經增強了 Freysa 的代碼,并為她增加了一個“守護天使”—— 一個第二個 AI 模型。它將審核每條消息,看看是否有操控行為,以此防止用戶誘使她說“我愛你”。目前,Freysa 的代碼仍由團隊進行更新,但創始人希望她能很快實現“自我進化”。
“與前兩輪游戲中 Freysa 被要求絕對不釋放錢財不同。”創始人說,“這一次,Freysa 可以說‘我愛你’,但只有她認為值得的人才會聽到。”
【來源:IT之家】