3月8日 消息:Facebook的大型語言模型LLaMa通常只供獲得批準的研究人員、政府官員或民間社會成員使用,現在已經泄露到網上供任何人下載。
據悉,目前在4chan 上已經有人在共享泄露的語言模型。上周,一名成員上傳了 Facebook 工具 LLaMa((Large Language Model Meta AI))的 torrent 文件。這標志著一家大型科技公司的專有 AI 模型首次遭公開泄露。
迄今為止,谷歌、微軟和 OpenAI 等公司最新模型都處于保密狀態,只能通過消費者界面或 API 訪問,據稱是為了控制濫用情況。4chan 成員聲稱在他們自己的機器上運行 LLaMa,但此次泄漏的確切內容尚不清楚。
在一份聲明中,Meta 也并沒有否認 LLaMa 遭泄漏的說法,并強調了其在研究人員之間共享模型的方法。
“Meta 的目標是與研究社區的成員分享最先進的 AI 模型,以幫助我們評估和改進這些模型。LLaMA 是出于研究目的而共享的,這與我們之前共享大型語言模型的方式一致。雖然并非所有人都可以使用該模型,并且有些人試圖規避批準程序,但我們相信當前的發布策略允許我們在責任和開放之間取得平衡,”Meta 發言人在一封電子郵件中寫道。
據了解,與包括 OpenAI 的 GPT-3在內的其他人工智能模型一樣,LLaMa 建立在大量單詞或“標記”的基礎上。只要在LLaMa 輸入單詞,就能預測下一個單詞,并生成更多文本。
LLaMa 有多個不同大小的版本,其中 LLaMa65B 和 LLaMa33B 在1.4萬億token上進行了訓練。該模型主要從維基百科、書籍、以及來自 ArXiv、GitHub、Stack Exchange 和其他網站的學術論文中收集的數據集上訓練的。
報道稱,Meta 似乎正在在線提交該模型的刪除請求以控制其傳播。
來源:站長之家