【ITBEAR科技資訊】4月23日消息,IT問答網站Stack Overflow日前宣布,計劃從今年年中起,向大型AI開發商收取數據訪問費用,付費后才可以獲取該平臺上的5000萬個問題與答案。據ITBEAR科技資訊了解,這是繼Reddit之后,又一家網站計劃收取數據使用費。
Stack Overflow是一個程序設計領域的問答網站,隸屬Stack Exchange Network。網站上最常見的問答主題包括Javascript、Java、C#、PHP、Android、Python、jQuery和HTML等。如今其注冊用戶已超過2000萬。
其首席執行官Prashanth Chandrasekar表示,“社區平臺推動了大語言模型(LLM)發展,所作出的貢獻也必須得到補償。”
科技巨頭或成主要收費對象,實際上,OpenAI、谷歌、meta等多家科技公司在建立大規模AI項目時,歷來不會為大部分訓練數據付費,而是選擇從網絡直接“搜刮”,數據來源便囊括上文提到的Stack Overflow和Reddit。當然,在美國此舉通常被看作合法行為,但仍存在一些版權與網站條款爭議。
同樣也是在本周,美國新聞媒體聯盟(The News/Media Alliance,前美國報業協會)公布多項原則,呼吁AIGC開發公司就數據使用展開談判,并要求這些開發公司尊重新聞媒體獲得公平補償的權利。
環球音樂集團(Universal Music Group)近日也發出警告,阻止AI服務從其受版權保護的歌曲中抓取旋律和歌詞。
Reddit透露,“我們正在處理這個問題,將在未來幾周內與合作伙伴分享更多信息。”Stack Overflow則表示,公司將借鑒研究Reddit的策略,并與潛在客戶展開協商,目前已與部分客戶就數據訪問進行接觸。
這兩家公司的收費方案或許都將針對大型科技公司:Stack Overflow稱希望收費對象僅限于以商用為目的開發LLM的大型公司;Reddit也有類似表態。而其余用戶與公司則有望繼續免費使用數據。
馬斯克或許也為這兩家公司提供可供借鑒的定價方案——本月馬斯克已提高推特數據訪問價格,起價為每月4.2萬美元,可訪問5000萬條推文。而就在本周三,馬斯克剛剛指控微軟非法使用推特數據來訓練其AI模型,還直言“訴訟時間到”,警告要起訴微軟。隨著越來越多的公司開始收費使用他們的數據,科技巨頭們的AI開發費用未來很可能會進一步上漲,同時技術開發時間或也將進一步延長。目前,Stack Overflow和Reddit并未發布具體的收費方案和價格信息,但隨著這一趨勢的不斷發展,我們不難預見未來數據使用費的普及程度將越來越高。