近日,Meta公司因其使用數(shù)千本盜版書籍訓(xùn)練人工智能模型的行為而陷入了版權(quán)侵權(quán)的訴訟之中。據(jù)報道,Meta使用了包含19.5萬本圖書、總?cè)萘拷?7GB的文本數(shù)據(jù)集“Books3”來訓(xùn)練其LLAM 1和LLAM 2模型。盡管該公司承認(rèn)了使用了這一數(shù)據(jù)集,但拒絕向其創(chuàng)作者支付相應(yīng)的補償金。
“Books3”數(shù)據(jù)集由AI研究者Shawn Presser于2020年創(chuàng)建,旨在為改進機器學(xué)習(xí)算法提供更好的數(shù)據(jù)源。然而,在這個數(shù)據(jù)集中包含了大量從盜版網(wǎng)站Bibliotik爬取的受版權(quán)保護作品。因此,Meta在使用這個數(shù)據(jù)集進行訓(xùn)練時面臨著法律風(fēng)險。
值得注意的是,今年已經(jīng)有幾位科技公司因在構(gòu)建生成式AI模型時侵犯藝術(shù)家、作者和其他內(nèi)容創(chuàng)作者的版權(quán)而受到指責(zé)。此外,歐盟正在制定關(guān)于人工智能的新臨時規(guī)則,這些規(guī)則可能會迫使公司披露用于訓(xùn)練模型的數(shù)據(jù)集。這無疑將使他們面臨更大的法律風(fēng)險。
【來源:中關(guān)村在線】