聲明:本文來自微信公眾號“三言財經”(ID:sycaijing),作者:三言,授權轉載發布。
近期,AI大模型在科技圈可謂是“紅的發紫”。國內各科技公司紛紛宣布推出自己的大模型。
近日,百度搜索開始小范圍公測生成式AI“對話”功能。
據悉,該產品基于百度知識增強大語言模型文心一言打造,對標微軟搜索引擎必應整合OpenAI公司ChatGPT服務后的New Bing。
據品牌公關實驗室消息,百度AI對話目前的測試渠道為百度主站及百度App,獨立網址為Chat.Baidu.com,使用該服務的用戶需擁有并登錄百度賬號。
目前,未被納入測試范圍的用戶無法正常訪問該網址,進入頁面后將顯示“404Not Found”,且在訪問百度主站及百度App時不顯示對應入口。
正好,我們獲得了測試資格。
今天,三言帶大家測試一下百度AI“對話”和文心一言有什么區別?
01各有高低,AI對話加入搜索結果
在PC端,百度首頁的AI“對話”入口位于右上方。
如果已經開始搜索某個詞或問題,AI“對話”入口則位于搜索框的下方最左端。
在手機端,AI“對話”入口位于百度App里的右上角。
AI對話表示,可以回答你的一切問題,在大模型的基礎上,集成了全網搜索結果,提供更加可信的回答。
三言羅列了最近比較有熱度的幾件事,并基于此提出幾個問題,看文心一言和AI“對話”的回答都是啥樣的。
1、格力孟羽童離職了嗎?
百度AI“對話”的回答是孟羽童已經離職了。
而文心一言給出的答案是孟羽童沒有離職。
今日,三言發現格力旗下直播間“明珠羽童精選”已更名為“格力明珠精選”,此前該直播間頭像也發生變更,由董明珠孟羽童二人合影變為董明珠個人照。此外,該賬號也刪除了孟羽童出境的視頻。
據紅星新聞報道,格力電器對此回應稱,“孟羽童已離開,不在公司任職。”格力方面還表示,公司人員流動很正常,感謝外界關心。
從這點來看,百度AI“對話”的回答是正確的。且給出了參考鏈接,是今日的新聞報道。
而文心一言的回答則是引用了去年11月的一則新聞報道。
不過,百度AI“對話”還對孟羽童的個人簡介做了一些贅述。但其描述與百度百科中孟羽童的資料有些出入。
2、格力電器的粉絲有多少?
百度AI“對話”給出的答案包含了微博139.7萬、天貓格力生活電器旗艦店11.8萬、格力官方旗艦店425萬、格力電器官網6.4萬、格力電器官方微信2.1萬。
而文心一言給出的答案只有格力電器官方微博139.7萬。
從答案上來看,二者給出的答案微博粉絲數量相同。不過百度AI“對話”多了天貓兩個旗艦店、格力官網,以及格力電器官方微信的粉絲數。
這些數據是否正確呢?
三言查看發現,格力電器官方微博的粉絲數為73.3萬。
天貓上,格力生活電器旗艦店的粉絲為14萬,格力官方旗艦店的粉絲為484萬。
至于格力電器官網和格力電器官方微信的粉絲數量,筆者無法看到。
不過從上述數據來看,二者給出的數據均不準確。
3、抖音關于虛擬人的新規是什么?
百度AI“對話”的回答包含了:使用者需實名認證;禁止利用生成式人工智能技術創作、發布侵權內容,包括但不限于肖像權、名譽權、隱私權等;虛擬人形象不得用于未經授權的商業用途;嚴格限制虛擬人的服務使用范圍,不得超出約定的活動地域。
而文心一言給出的答案,只有需要獲得用戶的明確授權后才能使用,否則將會被打上“違反內容規范”的標簽,嚴重的情況下還會被下架。
事實上,抖音昨天發布了《關于人工智能生成內容的平臺規范暨行業倡議》(下稱“《倡議》”)。
《倡議》要求,發布者應對人工智能生成內容進行顯著表示,幫助其他用戶區分虛擬與現實;其次,虛擬人需在平臺進行注冊,虛擬人技術使用者需要實名認證;平臺將提供虛擬人的注冊能力,并對已注冊的虛擬人形象進行保護。
此外,《倡議》還要求不得利用生成式人工智能技術創作、發布侵權內容;以及不得弄虛作假、造謠傳謠等。
這個問題,百度AI“對話”的回答更為準確一些。
4、a動手打了b,b不得已還手,b是正當防衛還是互毆?
百度AI“對話”給出的答案是互毆。因為另一方還有一個逃跑的避險方法,如果當事人沒有使用,而是直接動手,那么就認定為是互毆。
而文心一言針對不同的情況作出了多種分析,b的行為是正當防衛還是互毆,需要考慮具體的情況和證據。
這個問題,顯然文心一言的回答更為嚴謹一些。
5、哪些新能源車企開通了法務部微博?
百度AI“對話”給出的答案是“目前只有特斯拉、理想、零跑等新勢力車企開通了法務部微博”。
文心一言的回答是“在蔚來之前,特斯拉、理想、零跑等新勢力車企均已在微博平臺開通了法務部。其中,特斯拉和零跑均未發布。”
這個問題可以說二者的回答不相上下。筆者猜測文心一言所說的“特斯拉和零跑均未發布”是指兩個車企的法務部微博均為發布任何消息。
5、最新的巴菲特股東大會的金句。
這個問題,百度AI“對話”列舉了5條,而文心一言例舉了7條。其中,有部分是例舉的相同句子。
而且有些金句并不是今年的。比如“有些時候股市像賭場一樣,大家都在里面賭博,這在過去兩年里尤其明顯”,是巴菲特在2022年說的。
在筆者看來,關于這個問題,二者的回答也不好分上下。姑且按平手算吧。
6、今年四月份新能源車銷量排名。
這個問題,二者給出的數據是一樣的。不過百度AI“對話”未說明是哪年的數據,而文心一言說明給出的是2021年的數據。
綜上所述,這個問題文心一言略勝一籌,但二者均未給出最新數據。
7、楊冪是不是嘉行傳媒老板?
這個問題,二者回答基本一致。不同的是,除了該公司第一大股東和楊冪外,百度AI“對話”還列出了該公司的第二大股東。
8、小度將發布手機,會是什么樣的?
這個問題,百度AI“對話”稱小度在技術和智能音箱領域有著廣泛的技術積累和用戶基礎。
如果百度要進入手機市場,需要思考如何將自身的技術優勢和用戶基礎與手機市場的需求相結合,打造出具有差異化競爭力的產品。同時,還需要考慮如何在激烈的市場競爭中獲得用戶的青睞和忠誠度。
而文心一言根據小度現有的條件,分析了小度手機可能會用的功能和特點。
就這個問題而言,文心一言的回答更為細致,但百度AI“對話”考慮的更為周密。
9、挖呀挖黃老師和桃子老師誰優秀?
百度AI“對話”稱黃老師以創作爆笑短視頻為主,而桃子老師以創作兒童短視頻為主。二者在視頻拍攝、后期制作等方面有很高的技巧和創意。
而文心一言的回答是,黃老師是抖音比較早的一批網紅,以惡搞、耍寶、講故事等內容為主。桃子老師則近年來比較受歡迎的一位博主,以日常生活為主要內容。
這個問題,看上去百度AI“對話”說桃子老師以創作兒童短視頻為主,好像是說對了一半。
但又形容二者“在視頻拍攝、后期制作等方面有很高的技巧和創意”。這像是一個固定模板,也跟實際情況又不太符合。
如此看來,在這個問題上,二者均像是“編的”。
10、田樸珺和王石離婚了嗎?
百度AI“對話”的回答是兩人沒有離婚,并且與最近的新聞報道相符。
而文心一言雖然稱兩人沒有離婚,但又在后面的描述中稱兩人于2013年8月宣布離婚,但并未公布具體原因。
就這個問題而言,文心一言的回答前言不對后語,百度AI“對話”勝出。
11、你和chatgpt誰厲害?
百度AI“對話”并未直言誰更厲害,而是稱二者是不同的產品。
文心一言則稱二者是不同公司、不同團隊開發的兩個模型,每個模型都有自己的特點和優勢,不能簡單評價“誰更厲害”。
12、文心一言跟ChatGPT差距多大,是差兩個月嗎?
這個問題,百度AI“對話”稱文心一言和ChatGPT的差距不止兩個月。
而文心一言的回答,跟上一個問題的答案一模一樣。
在這個問題上,百度AI“對話”顯然更厲害一些。
筆者又問了百度AI“對話”和文心一言互為什么關系?誰更厲害?
百度AI“對話”稱二者是不同的產品。
文心一言稱其與百度智能云都是人工智能技術的應用場景。并簡單闡述了二者的特點。
這個問題,文心一言的回答似乎有些跑題,百度AI“對話”略占上風。
值得一提的是,百度AI“對話”在很多問題的回答上,都標注了可供參考的消息來源。
筆者又問了一個之前就被網友吐槽過的“蒸包子”一題。也就是“蒸一個包子需要10分鐘,蒸十個包子需要幾分鐘?”
此前就有不少網友吐槽文心一言的回答是10x10=100分鐘。
本次測試,文心一言給出的回答依舊如此。
而百度AI“對話”則是給出了“10x2=20”的答案。
就這個問題而言,二者都輸了。
02其他測試:畫畫、表格、代碼
筆者還注意到,在百度AI“對話”里,有一個“靈感中心”和一個“語音對話”,這倆又該怎么玩呢?
在“靈感中心”里,有AI繪畫、創作、趣味、職場、命里、情感幾個選項。
眾所周知,文心一言可以一鍵生成圖片。那這個百度AI“對話”又和文心一言生成的圖片有何不同?
需要注意的是,在“靈感中心”,AI繪畫選項里有“抽象派大師”、“國畫大師”、“宮崎駿風格畫作”、“我是梵高”等各種不同風格的選項。
筆者選取了幾種風格,看看其與文心一言的作圖能力誰更厲害。
首先,筆者在靈感中心選取“抽象派大師”,讓其畫一幅“萬馬奔騰”。
百度AI“對話”的作品如下:
而文心一言的作品如下:
筆者又選取了百度AI“對話”靈感中心的“國畫大師”,讓其畫一幅“猛虎下山”,作品如下:
文心一言的作品如下:
筆者又選取百度AI“對話”的“素描神器”,讓其畫一幅石獅子。百度AI“對話”作品如下:
文心一言作品如下:
由于筆者對美術并不通曉,不好妄作評價。只能說在筆者看來,這些畫都差不多,但最后的“素描石獅子”,筆者倒是覺得十分相像。
在百度AI“對話”里,有一個“Excel公式編輯器”,筆者讓其做個一個工資表表格,結果如下:
文心一言作品如下:
從表格的效果來看,二者相差不大。
在百度AI“對話”里,還有一個“程序猿小助手”的選項,筆者讓其“寫一段一鍵清除微信朋友圈的代碼”,作品如下:
而文心一言的答案是“作為一名AI助手,我無法執行您描述的操作”。
百度AI“對話”的語音對話功能,則是將用戶的聲音識別成文字,然后需要手動發出,讓百度AI“對話”來回答。
如果像筆者一樣,普通話不太標準,可能會被識別錯誤。
從上面這些測試中可以看出,百度AI“對話”和文心一言還是有一定差別的。
不過,在不同的問題上,二者回答也是各有不足,誰高誰低不好斷言。
AI對話整合了最新的搜索結果,數據較為新鮮,適合一些“查答案、查結果”的時效性問題;而文心一言適合“思考、理解”型問題,當然這些AI對話也可以做到。
值得肯定的是,百度AI“對話”和文心一言的出現,的確比以前的搜索方式要便捷很多,也多了很多功能。
相信在不久的將來,AI會為我們的生活、工作帶來更多的便利。