(ChinaZ.com) 5月12日消息:在本周三的 I/O 大會上,谷歌預覽了可能是其歷史上最大的搜索引擎變革之一。
谷歌將使用人工智能模型在響應搜索查詢時從互聯網上匯總并概述信息,該產品稱為「搜索生成式體驗」。
谷歌將向一些用戶展示生成 AI 的文本段落和少量鏈接,而不是「十個藍色鏈接」,這是描述谷歌通常的搜索結果的短語。
新的基于 AI 的搜索正在針對一小部分用戶進行測試,尚未廣泛推出。但網站站長們已經擔心,如果這成為谷歌呈現搜索結果的默認方式,可能會通過減少訪問者訪問他們的網站并讓他們停留在 Google.com 上傷害他們的利益。
這場爭議凸顯了谷歌與它所索引的網站之間長期存在的緊張關系,并添加了新的人工智能元素。網站站長一直擔心谷歌在其自己的網站上以片段的形式重復使用他們原始的內容,但現在谷歌正在使用高級機器學習模型從大量網頁中抓取信息,從而「訓練」軟件生成類似人類的文本和回應。
聚焦游戲新聞和評測的網站 TechRaptor 的首席執行官 Rutledge Daugette 表示,谷歌的舉動沒有考慮網站的利益,而谷歌的人工智能等同于抄襲內容。
Daugette 告訴 CNBC:「他們的重點是零點擊搜索,該搜索使用發布者和撰寫高質量內容的作家的信息,而沒有提供任何除潛在點擊之外的好處。目前,人工智能很快地復用其他人的信息,對他們沒有任何好處,而在谷歌這樣的情況下,Bard 甚至沒有注明該信息的來源。」
Yelp 的公共政策主管和長期的谷歌批評者 Luther Lowe 表示,谷歌的更新是為了將用戶留在自家網站上更長時間,而不是將他們引導到最初承載該信息的網站。
Search Engine Land 是一家密切跟蹤谷歌搜索引擎變化的新聞網站,據該網站報道,到目前為止,人工智能生成的結果顯示在迄今為止測試的自然搜索結果上方。該網站此前報道了谷歌計劃重新設計搜索結果頁面以促進生成的 AI 內容的計劃。
在搜索中,SGE 出現在不同顏色的框中,例如綠色框,并在右側顯示三個網站的鏈接。在谷歌的主要示例中,所有三個網站的標題都被截斷了。
谷歌表示,該信息并非來自網站,而是通過鏈接進行協作的。Search Engine Land 稱,SGE 方法是一種改進和比谷歌的 Bard 聊天機器人更「健康」的鏈接方式,后者很少鏈接到原始信息來源的網站。
一些發布者正在思考他們是否可以阻止像谷歌這樣的 AI 公司抓取其內容以訓練其模型。數據所有者的公司,如 Stable Diffusion 背后的公司已經面臨訴訟,但有關 AI 抓取 Web 數據的權利仍然是一個未決的領域。其他公司,如 Reddit,已宣布計劃收費以獲得對其數據的訪問權限。
在出版界領先的是 IAC 的主席 Barry Diller,該公司擁有 All Recipes、People Magazine 和 The Daily Beast 等網站。
Diller 在上個月的一個會議上說:「如果所有的世界信息都能夠被吸入這個漩渦,然后重新打包,在所謂的聊天中——但這并不是聊天——而是用任意數量的信息嫁接,25 個任意主題——這樣就不會有網站了,因為這是不健康的。」
Diller 繼續說:「你必須讓行業說,在你解決了網站獲得某些收益途徑的系統之前,你不能抓取我們的內容。」
Diller 表示,他相信發布者可以根據版權法起訴 AI 公司,并且需要重新定義當前的「合理使用」限制。據《金融時報》報道,Diller 正在領導一個內容商的團體,「如果必要,他們將改變版權法。」IAC 的一位發言人拒絕了接受 Diller 采訪的請求。
內容商面臨的一個挑戰是確認他們的內容是否正在被 AI 使用。谷歌沒有透露其支撐 SGE PaLM 2 的大型語言模型的訓練來源,Daugette 表示,雖然他已經看到競爭對手的引用和評論分數的例子被沒有進行歸屬的復用在 Bard 上,但沒有直接鏈接的來源時很難判斷信息是否來自他的網站。
谷歌的舉動令獨立出版商的生存變得困難。Daugette 說:「我認為我們的行業必須擔心我們辛勤工作的成果被剽竊,而許多同行正在被裁員。這是不好的。」