【ITBEAR】舊金山的一家人工智能初創公司Writer最近推出了一款全新的大型人工智能模型,意圖與OpenAI、Anthropic等業界巨頭展開競爭。令人矚目的是,Writer聲稱其訓練成本遠低于競爭對手,僅需約70萬美元,涵蓋了數據和GPU等費用,而其他初創公司往往需要數百萬美元來構建模型。這一低成本策略吸引了投資者的廣泛關注。
人工智能領域的一項研究發現,如果當前的發展趨勢持續,科技公司將在2026年至2032年間耗盡所有公開可用的訓練數據。這表明,依賴人類生成的公共文本數據將無法維持未來的規模化需求。事實上,亞馬遜已使用合成數據訓練Alexa,meta也用它來微調Llama模型,而微軟同樣在探索將合成數據納入其由OpenAI支持的模型中。
然而,盡管合成數據帶來了諸多優勢,一些專家仍警告需謹慎使用,因為它可能降低模型性能并加劇現有偏見。對此,Writer的聯合創始人兼首席技術官Waseem Alshikh向CNBC表示,Writer多年來一直致力于合成數據管道的研發,并強調他們不會在虛假或幻覺數據上訓練模型,而是采用真實的事實數據,并將其轉換為更清晰、更干凈的合成數據用于模型訓練。
生成式人工智能市場展現出巨大的潛力,預計未來十年內有望實現1萬億美元的收入。據PitchBook數據,截至2024年,投資者已向498筆生成式人工智能交易投入了268億美元,該領域的公司在2023年籌集了259億美元,比2022年增長了200%以上。