日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

點擊這里在線咨詢客服

網站：52000
待審：37
小程序：12
文章：1037587
會員：756

首頁 > 新聞資訊 > 短視頻 >正文

OpenAI 轉錄了超過一百萬小時的 YouTube 視頻來訓練 GPT-4

發布時間：2024-04-07 09:28:00 作者：網友整理

(ChinaZ.com) 4月7日消息:近日，《華爾街日報》報道稱，人工智能公司在收集高質量訓練數據方面遇到了困難。隨后，《紐約時報》詳細介紹了一些公司處理這一問題的方法，其中涉及到了人工智能版權法的模糊灰色區域。

故事從OpenAI開始。該公司迫切需要訓練數據，據報道開發了Whisper音頻轉錄模型，轉錄了超過100萬小時的YouTube視頻來訓練其最先進的大型語言模型GPT-4。《紐約時報》報道稱，OpenAI知道這在法律上存在問題，但相信這是合理使用。OpenAI總裁格雷格·布羅克曼親自參與了所使用視頻的收集。

youtube 油管

OpenAI發言人林賽·赫爾德告訴The Verge，該公司為每個模型策劃了"獨特"的數據集，并使用"眾多來源，包括公開數據和非公開數據的合作伙伴"。赫爾德還表示，該公司正在考慮生成自己的合成數據。

據《紐約時報》消息人士透露，谷歌也從YouTube收集了文字記錄。谷歌發言人馬特·布萊恩特表示，該公司"根據我們與YouTube創作者的協議，在一些YouTube內容上訓練了模型"。

Meta同樣也遇到了良好訓練數據可用性的限制。該公司在努力追趕OpenAI的過程中，曾考慮未經許可使用版權作品的情況，包括支付圖書許可費用或直接收購一家大型出版商。

這些公司正在努力應對模型訓練數據快速蒸發的問題。《華爾街日報》本周撰文稱，到2028年，公司可能會超越新內容。解決方案包括對模型創建的"合成"數據進行訓練，或采用"課程學習"方法。但這些公司的另一個選擇是使用他們能找到的任何東西，無論他們是否獲得許可，這可能會引發版權法方面的擔憂。

分享到：

標簽：人工智能數據收集訓練模型版權法高質量數據 YouTube轉錄

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

52000
網站
12
小程序
1037587
文章
756
會員

趕快注冊賬號，推廣您的網站吧！

文章分類

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com
免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com
魔扣科技 www.ylptlb.cn
體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/
中合網 www.heelcn.com
中當網 www.deelcn.com
魔扣網站維護代運營 www.ylptlb.cn/tg
中合網-健康養生知識科普名站 m.heelcn.com
各百科 www.geelcn.com

最新入駐小程序

數獨大挑戰

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定

熱門文章