【ITBEAR科技資訊】7月16日消息,據消息來源透露,meta 公司近日宣布研發出了一款名為CM3Leon的人工智能模型,引起了廣泛關注。這款模型據稱在文本到圖像生成方面取得了行業領先的成果,超越了谷歌和微軟等公司的產品。
CM3Leon是一種基于Transformer的模型,Transformer是一種利用注意力機制處理輸入數據的神經網絡結構。相較于其他基于擴散的模型,這種基于Transformer的模型更加高效,具備更快的訓練速度和更低的計算成本。
meta 公司展示了CM3Leon在多個任務上的出色表現,包括根據復雜的文本提示生成圖像、根據文本指令編輯圖像,以及生成圖像描述和回答。該公司認為CM3Leon的問世是圖像生成和理解領域的一大進步。
據ITBEAR科技資訊了解,meta 公司為訓練CM3Leon使用了數百萬張授權圖片,這些圖片來自Shutterstock。最強大的CM3Leon版本擁有70億個參數,比OpenAI的DALL-E 2模型多出兩倍。
盡管CM3Leon在技術上取得了顯著的突破,meta 公司也承認該模型可能存在數據偏見的問題,并呼吁行業加強透明度和監管。關于CM3Leon是否會公開發布,目前meta公司尚未透露具體計劃。
CM3Leon的發布將對圖像生成和理解領域帶來巨大的影響,并為相關技術的發展鋪平道路。這一成果的問世將進一步推動人工智能技術的創新與應用,為未來的科技發展開辟更加廣闊的前景。