【ITBEAR科技資訊】8月1日消息,Reddit的CEO史蒂夫?霍夫曼近日公開表示,微軟等公司若希望繼續獲取Reddit網站的數據,將需要支付費用。Reddit此前已經與谷歌和OpenAI達成了相關協議。
霍夫曼強調,如果沒有這些明確的協議,Reddit將無法掌控或知悉其數據如何被使用,這使得他們不得不屏蔽那些不接受數據使用條款的公司。他特別提到了微軟、Anthropic和Perplexity三家公司,批評他們拒絕進行談判,并稱對這些公司的封鎖“極其繁瑣”。
據ITBEAR科技資訊了解,近幾個月來,Reddit在反爬蟲方面采取了更為嚴格的措施。7月初,Reddit對其robots.txt文件進行了更新,以此屏蔽未經許可的網絡爬蟲。隨后,用戶們發現,Reddit的內容僅在谷歌搜索結果中顯示,而在其他搜索引擎如Bing上則無法找到。
霍夫曼指責微軟在未經授權的情況下,利用Reddit的數據進行AI訓練,并在Bing搜索結果中整合Reddit的內容,甚至通過Bing API將這些數據出售給其他搜索引擎。他還對微軟AI負責人穆斯塔法?蘇萊曼之前的言論進行了回應,蘇萊曼曾稱互聯網上的公共數據為“免費軟件”。霍夫曼表示,微軟等公司的真實立場是認為互聯網上的所有內容都可以供他們無償使用。
對于Reddit內容從Bing搜索結果中消失一事,微軟搜索主管喬迪?里巴斯在社交平臺上指出,這是因為Reddit屏蔽了Bing的爬蟲,同時偏袒另一家搜索引擎,這對Bing以及基于Bing的搜索引擎構成了競爭上的不利影響。微軟發言人凱特琳?勞爾頓也聲明,公司尊重那些不希望其內容被用于生成式AI模型的網站意愿。
霍夫曼以OpenAI的SearchGPT為例,說明了付費協議的重要性。今年初,Reddit與OpenAI達成了協議,允許SearchGPT展示Reddit的內容。Reddit的發言人蒂姆?拉特施密特澄清,目前簽訂的所有內容許可協議均不涉及數據的獨家使用權。
Reddit的這種付費要求與傳統媒體出版商的做法相似,他們也期望從允許其內容用于生成式AI中獲得經濟回報。霍夫曼認為,搜索引擎的傳統價值交換方式已經轉變,搜索、摘要和訓練正在逐步融合,單純依賴爬取內容以換取流量的模式已變得模糊不清。