(ChinaZ.com) 9月2日消息:《衛(wèi)報(bào)》已經(jīng)阻止 OpenAI 從其內(nèi)容中獲取數(shù)據(jù)。該出版商是最新一家阻止人工智能公司使用其內(nèi)容來(lái)創(chuàng)建 ChatGPT 等產(chǎn)品的新聞機(jī)構(gòu)。
擔(dān)心 OpenAI 正在使用未經(jīng)許可的內(nèi)容來(lái)創(chuàng)建其人工智能工具,已導(dǎo)致作家對(duì)該公司提起訴訟,并呼吁創(chuàng)意產(chǎn)業(yè)采取措施保護(hù)知識(shí)產(chǎn)權(quán)。
《衛(wèi)報(bào)》確認(rèn)已禁止 OpenAI 部署軟件以收集其內(nèi)容。生成式人工智能技術(shù)——指可以從簡(jiǎn)單的人類提示中生成令人信服的文本、圖像和音頻等產(chǎn)品——自去年推出 ChatGPT 聊天機(jī)器人版本以來(lái)就受到公眾矚目。然而,有關(guān)虛假信息大規(guī)模生產(chǎn)和此類工具建立方式的擔(dān)憂也隨之而來(lái)。
ChatGPT 及類似工具背后的技術(shù)是通過(guò)向其中輸入大量來(lái)源于開(kāi)放互聯(lián)網(wǎng)(包括新聞文章)的數(shù)據(jù)進(jìn)行「訓(xùn)練」的,使得這些工具可以預(yù)測(cè)用戶提示后最可能出現(xiàn)哪個(gè)單詞或句子。
OpenAI 并沒(méi)有透露幫助構(gòu)建 ChatGPT 模型背后所用數(shù)據(jù),但在 8 月份宣布將允許網(wǎng)站運(yùn)營(yíng)者阻止其網(wǎng)絡(luò)爬蟲程序獲取他們的內(nèi)容,盡管此舉并不允許從現(xiàn)有的訓(xùn)練數(shù)據(jù)集中刪除材料。目前,一些出版商和網(wǎng)站正在阻止 GPTBot 爬蟲程序。
《衛(wèi)報(bào)》及其子公司 Guardian News & Media 的發(fā)言人表示:「出于商業(yè)目的從衛(wèi)報(bào)網(wǎng)站上竊取知識(shí)產(chǎn)權(quán)的行為一直以來(lái)都違反了我們的服務(wù)條款。這一點(diǎn)始終如一。《衛(wèi)報(bào)》商業(yè)授權(quán)團(tuán)隊(duì)與全球開(kāi)發(fā)者之間有著多種互惠互利的商業(yè)關(guān)系,并期待未來(lái)建立更多這樣的關(guān)系。」
根據(jù) Originality.ai 檢測(cè)到 AI 生成內(nèi)容顯示,現(xiàn)在阻止 GPTBot 爬蟲程序(該程序從網(wǎng)頁(yè)中提取數(shù)據(jù)以供其 AI 模型使用)的新聞網(wǎng)站包括 CNN、路透社、華盛頓郵報(bào)、彭博社、紐約時(shí)報(bào)及其體育網(wǎng)站 The Athletic 等。其他已經(jīng)阻止 GPTBot 爬蟲程序的網(wǎng)站還包括 Lonely Planet、亞馬遜 (Amazon)、Indeed,、問(wèn)答平臺(tái) Quora 和 dictionary.com。
本周,英國(guó)圖書出版商敦促其首相 Rishi Sunak 通過(guò)在 11 月主持英國(guó)安全峰會(huì)議程上加入保護(hù)創(chuàng)意產(chǎn)業(yè)知識(shí)產(chǎn)權(quán)來(lái)保護(hù)創(chuàng)意產(chǎn)業(yè)知識(shí)產(chǎn)權(quán)。代表數(shù)字和印刷書籍、研究期刊和教育內(nèi)容的出版商協(xié)會(huì)的一封信要求首相明確表示,在構(gòu)建 AI 系統(tǒng)時(shí)必須尊重知識(shí)產(chǎn)權(quán)法。
今年 7 月,埃隆·馬斯克對(duì)其 Twitter 平臺(tái)(現(xiàn)已更名為 X)施加了限制,以解決他所聲稱的人工智能公司構(gòu)建模型的「極端程度的數(shù)據(jù)抓取」問(wèn)題。他在 Twitter 上表示,「幾乎每家從事人工智能的公司」都從 Twitter 獲取「大量數(shù)據(jù)」,馬斯克表示,這迫使該公司付出一定代價(jià)部署更多服務(wù)器來(lái)滿足需求。
然而,馬斯克也確認(rèn)將使用公共推文來(lái)訓(xùn)練其新宣布的 AI 初創(chuàng)企業(yè) xAI 開(kāi)發(fā)的模型。
谷歌的隱私政策現(xiàn)在規(guī)定,該公司使用網(wǎng)絡(luò)爬蟲幫助用戶查找搜索結(jié)果,可能會(huì)收集公開(kāi)信息來(lái)訓(xùn)練谷歌人工智能產(chǎn)品的模型,其中包括 Bard 聊天機(jī)器人。本周,F(xiàn)acebook 和 Instagram 的所有者以及主要人工智能開(kāi)發(fā)商 Meta 推出了一項(xiàng)新政策,允許用戶表示是否不希望自己的個(gè)人信息用于訓(xùn)練人工智能模型。