(ChinaZ.com)11月8日 消息:不得不說,網友真的太會整活了。11月3日,B站UP主“精致的男孩富貴”展示了國內大型語言模型的智商測試。他以一種輕松幽默的方式挑戰了這一強大的技術。
在這個視頻中,UP主選擇了“淘寶問問”和“文心一言”這兩個典型的互聯網平臺,以它們作為代表進行測試。他提出了一系列看似毫無意義的問題,例如,“神父去世了算升職還是降職?”或者“天上有9個太陽的時候,向日葵應該往哪里看呢?” 這些問題都源自于一個著名的互聯網段子社區“弱智吧”。
許多網友戲稱“弱智吧”實際上是中國人的“圖靈測試”,因為它以一種令人困惑的方式考驗了人工智能的智能水平。UP主的目標是查看大型語言模型是否能夠理解這些抽象但嚴肅的問題,以及是否能夠提供有意義的答案。
然而,結果卻讓人大吃一驚。即便面對這些毫無邏輯的問題,人工智能也可以一本正經地瞎扯淡。這顯示出大型語言模型在邏輯推理方面存在明顯不足。盡管這些問題看似無厘頭,但它們含有大量的邏輯陷阱,而大語言模型的答案正確率反映了其邏輯能力的局限性。
截至發稿時,UP主的視頻已經獲得了超過71.1萬的播放量,并收獲了6.6萬的點贊。在評論區,眾多網友也積極分享了他們與人工智能互動的經歷,使用“弱智吧”的段子挑戰大型語言模型的智能。
UP主最后指出,通過使用更多的數據和改進的算法,可以提高模型的推理和決策能力?;蛟S在未來的某一天,人工智能將能夠勝過“弱智吧”,并提供更有趣和有意義的回答。這個視頻引發了對人工智能能否應對復雜邏輯和無厘頭問題的深刻思考,也讓人們對技術的發展充滿了期待?;ヂ摼W的精彩之處在于,它不斷引領著我們走向未知的未來。