AI的進步讓人們在5月底登錄HBO Max時注意到了一些奇怪的變化。通常情況下,當用戶登錄該網站時,HBO會要求他們通過解決驗證碼來驗證自己是人類。這些驗證碼可能是簡單的“我不是機器人”復選框,或者要求選擇所有包含紅綠燈的方格圖像。這樣的驗證方式可以確保用戶確實是人類。
然而,這一次,用戶登錄時被要求解決一系列復雜的難題,而不再是簡單的驗證碼。這些新的任務范圍很廣,涉及計算圖像上的骰子點數,以及聽短音頻剪輯并選擇包含重復聲音模式的剪輯。而這種新的、看似證明用戶是人類的任務并不僅限于HBO:在各個平臺上,用戶都面臨著越來越難以通過的難題,例如識別像云朵組成的馬這樣根本不存在的對象。
那么,為什么會出現這些新的障礙呢?原因在于AI的進步。科技公司利用傳統的驗證碼訓練了他們的機器人,使這些程序變得非常強大,可以輕松應對常見的挑戰。因此,我們人類現在必須付出更多的努力來證明我們是人類,才能繼續使用互聯網。然而,這些令人困惑的驗證碼只是AI改寫互聯網機制的冰山一角。
自從ChatGPT去年問世以來,科技公司紛紛將其背后的AI技術融入產品中。在許多情況下,公司已經徹底改變了他們長期以來的核心產品。僅僅通過點擊按鈕,就可以生成看似權威的文字和視覺效果,這對互聯網脆弱的機構構成了威脅,使瀏覽網絡變得一團糟。隨著AI的狂潮席卷互聯網,研究人員發現它可以被利用來加劇互聯網一些最緊迫的問題,例如錯誤信息和隱私,同時也讓日常的在線體驗變得更加煩人,從清除垃圾信息到登錄網站都變得更加麻煩。
迄今為止,AI正在讓互聯網成為一個噩夢。
互聯網顛覆
近20年來,Reddit一直被視為互聯網的非官方頭版,這主要得益于其各個社區的志愿管理員。據估計,Reddit的管理員每年提供價值340萬美元的無償工作。為此,他們依賴于一些工具,如Apollo等,這是一款有近10年歷史的應用,提供高級管理功能。然而,在6月份,用戶看到了一個不尋常的消息:Apollo將停止服務。在公司試圖通過AI熱潮迅速賺錢的過程中,第三方應用成為了被砍掉的對象。
Apollo和其他類似的界面依賴于Reddit的應用編程接口(API)來進行數據交換。過去,Reddit允許任何人免費抓取其數據,因為Reddit允許更多的工具,就能吸引更多的用戶,有助于應用的增長。然而,現在AI公司開始利用Reddit及其海量的在線人類互動數據來訓練他們的模型。為了從中獲利,Reddit宣布了新的高價數據訪問服務。Apollo和其他應用成為了附帶損害的對象,引發了Reddit社區長達一個月的抗議和動蕩。即使這意味著失去組成其核心的社區用戶,該公司也堅持己見。
根據歐洲刑警組織的一份報告預計,未來幾年內,90%的互聯網內容將由AI生成。這個預測表明,AI正逐漸在互聯網中發揮越來越重要的作用。AI的發展勢頭迅猛,已經開始影響到我們平日里的在線體驗。然而,我們也必須認識到AI的潛在風險和挑戰,特別是在數據訪問和隱私保護方面。只有在平衡好利益和風險的前提下,我們才能更好地應用AI技術,讓互聯網成為一個更加美好和繁榮的地方。
隨著數據抓取現金牛的興起,曾經可靠的網站質量開始下降,大量可疑的AI生成內容涌入網絡頁面。劍橋的軟件工程師馬丁·皮特斯最近親眼目睹了Stack Overflow的衰落,這是互聯網技術問題和答案的首選網站。當該網站運營商Prosus決定允許AI生成的答案,并開始向AI公司收費提供數據訪問時,他參與和管理了這個平臺超過10年,但在6月份發生了急劇轉變。作為回應,頂級管理員罷工,認為低質量的AI生成內容與該網站最初的目標相矛盾,即成為高質量問題和答案內容的存儲庫。
AI經常會對問題產生錯誤的答案,除非AI模型經過微調并設置了保護措施,否則根據NewsGuard聯合CEO Gordon Crovitz的說法,它們將成為互聯網歷史上最大規模的有說服力的錯誤信息來源。歐洲聯盟執法機構歐洲刑警組織的報告預計,在未來幾年內,互聯網內容中將有令人難以置信的90%是AI生成的。
盡管這些AI生成的新聞網站的受眾還不多,但它們的快速崛起預示著AI生成內容將如何輕易地在社交媒體上扭曲信息。菲利波·門澤爾是印第安納大學社交媒體觀察站的主任和計算機科學教授,他在研究中發現了大量機器人網絡發布ChatGPT生成的內容到Twitter(現為X)和Facebook等社交媒體網站。盡管AI機器人目前具有明顯的特征,但專家指出,它們很快就會變得更善于模仿人類并逃避門澤爾和社交網絡開發的檢測系統。
與Reddit和社交媒體平臺這樣的用戶驅動型網站不同,人們也正在失去一個關鍵的驗證信息來源:搜索引擎。微軟和谷歌即將用機器人生成的摘要取代傳統的搜索結果鏈接,但這些機器人區分事實與虛構的能力非常有限。當我們在谷歌上搜索一個查詢時,我們不僅了解答案,還了解它在互聯網更廣泛背景下的關聯。我們通過過濾這些結果,然后選擇我們信任的來源來獲取信息。由聊天機器人驅動的搜索引擎切斷了這種體驗,剝奪了網站地址等上下文,并可以“模仿”剽竊的答案,就像NewsGuard的Crovitz所說,這些答案聽起來“權威且寫得很好”,但實際上是“完全虛假的”。
合成內容也淹沒了亞馬遜和Etsy等電子商務平臺。俄勒岡州波特蘭的課程工程師克里斯托弗·科威爾在他的技術教科書即將出版的兩周前,在亞馬遜上發現了一本同名的新書。科威爾很快意識到這是AI生成的,出版商很可能從亞馬遜的預發布名單中獲取了標題,并將其輸入到ChatGPT等軟件中。類似地,在以手工藝品和工匠目錄而聞名的E保持角色扮演。
詐騙盛宴
AI的崛起給安全和隱私帶來了一系列現實挑戰。網絡詐騙的增長將變得更加難以檢測,因為AI使得定制針對每個目標的欺詐更加容易。南佛羅里達大學計算機科學教授約翰·利卡托的研究表明,即使只有公共網站和社交媒體簡介上的少量信息,也有可能精確地設計針對個人偏好和行為傾向的騙局。
高風險網絡釣魚騙局的一個關鍵特征是文本中經常包含拼寫錯誤或圖像不夠清晰。然而,在由AI驅動的欺詐網絡中,這些特征將不存在,黑客們可以將免費的文本轉化為圖像和文本生成器(如ChatGPT)生成的強大垃圾郵件引擎。生成式AI可能會被用來在品牌的個性化電子郵件營銷中插入你的個人頭像,或者制作政治家的視頻留言,使用經過人工調整的聲音,專門討論你所關心的話題。
"互聯網將越來越感覺到它是為機器而由機器設計的。"這已經開始發生:網絡安全公司Darktrace的數據顯示,自2023年初以來,惡意網絡活動增加了135%,犯罪分子越來越多地依賴機器人來編寫釣魚郵件,以發送錯誤更少、內容更長、更不太可能被垃圾郵件過濾器捕獲的信息。
很快,黑客可能無需過多努力就能獲取您的敏感信息。目前,黑客通常采用各種間接方法來監視您,包括在網站中隱藏跟蹤器和從暗網購買大量被盜信息數據集。但安全研究人員已經發現,您的應用和設備中的AI機器人可能成為黑客竊取敏感信息的目標。由于OpenAI和谷歌的AI模型主動爬取網絡,黑客可以在網站內隱藏惡意代碼(一組機器人指令),并使機器人在沒有人為干預的情況下執行這些指令。
"由于這些風險,目前管理您的電子郵件、日歷、購買等任務的智能AI助手是不可行的,"Tramèr說道。在面對AI帶來的安全和隱私挑戰時,我們需要保持警惕,并采取適當的措施來保護我們的個人信息和在線安全。
“死亡的互聯網”
隨著AI在維基百科和Reddit等社區中繼續主導計劃并造成破壞,互聯網將逐漸感受到它更像是為機器而由機器設計的。新南威爾士大學的人工智能教授托比·沃爾什告訴我,這可能會打破我們目前對網絡的習慣。這也會給AI制造商帶來困難,因為AI生成的內容淹沒了人類的工作,科技公司如微軟和谷歌將有更少的原創數據來改進他們的模型。
"當前的AI之所以有效,是因為它是通過人類的努力和創造力進行訓練的,"沃爾什說道。"如果第二代生成AI是在第一代的副產品基礎上進行訓練,其質量將會急劇下降。"今年5月,牛津大學的一項研究發現,使用其他AI系統生成的數據來訓練AI會導致其性能下降并最終崩潰。隨之而來的是,網上信息的質量也會下降。
南佛羅里達大學的利卡托教授將當前的網絡體驗比作"死亡的互聯網"理論。隨著Reddit等受歡迎的互聯網網站被機器人撰寫的文章和評論淹沒,公司將不得不部署更多的反機器人技術來讀取和過濾自動化內容。理論認為,最終互聯網上的大部分內容創作和消費將不再由人類完成。
"這聽起來很奇怪,但考慮到目前的發展趨勢,這似乎變得越來越可能,"利卡托說道。
我無法不表示贊同。在過去的幾個月里,我曾經常訪問的在線空間要么被AI生成的內容和面孔淹沒,要么因為追趕競爭對手的AI更新而嚴重削弱了核心服務。如果這種情況繼續下去,互聯網將永遠不會再是同樣的。