近期,關于OpenAI“草莓”項目的討論熱度持續攀升,引發了廣泛關注和熱議。其中,Perplexity AI的首席執行官的一條暗示性推文,更是讓這一話題推向了新的高潮。網友們紛紛進行在線測試,無形之中為自家的AI進行了一輪宣傳。
這一周以來,OpenAI的“草莓”項目被炒得沸沸揚揚,讓眾多關注者情緒高漲。在社交媒體X上,一位名為@iruletheworldmo的爆料者頻繁發帖,內容幾乎都與“草莓”項目相關,甚至暗示本周二將是OpenAI實現第二級AGI的重要日子。
據ITBEAR了解,這位爆料者自稱已獲得內部消息,并表示全新的GPT-4o large模型將于8月13日正式發布。然而,在OpenAI的“草莓”項目真正露面之前,其競爭對手Perplexity AI已經展示了具備類似“草莓”能力的新模型。
或者說,Q*已經在Perplexity Pro上實現了這一功能。Perplexity AI的CEO Aravind Srinivas發布了一張自家AI破解“草莓測試”的圖片,引發了在線猜測——
“猜猜這是什么模型?”
與許多模型連一個單詞“strawberry”中的“r”數量都搞不清楚的情況相比,Perplexity AI的表現無疑令人印象深刻。
在另一個演示中,AI被問及如果將火星表面全覆蓋需要多少草莓。AI首先預估了火星的面積,然后計算了一個草莓的平均大小和所占面積,最后得出了覆蓋火星表面所需草莓的數量為1.87×10^17。
Perplexity AI是否真的上線了與OpenAI“草莓”能力相當的模型?這一問題引發了廣泛討論。網友們實測后發現,Perplexity Pro的強大之處在于它能夠通過逐步、漸進式的思考給出結果。
例如,當查詢大腦中量子糾纏現象時,AI會搜索關于量子糾纏的信息及其潛在含義,或與大腦相關的理論,然后進一步查詢最近關于量子糾纏對大腦/意識產生影響的研究或理論。
有網友實測表示,Perplexity AI可以輕松搞定任意單詞或句子中的“r”。然而,也有網友發現,Perplexity在這里其實有“作弊”的嫌疑——它并沒有去“數”,而是調用代碼解釋器寫了一段代碼,然后給“算”了出來。
評論區里,網友們意見不一。有的人認為,這是原理幻覺的一個很好的步驟。而也有人認為,這是炒作,他們可能在字符串中數出n個字母,添加了25個微調的對話。