【ITBEAR科技資訊】6月6日消息,騰訊今日發布了一款針對其開源大模型——騰訊混元文生圖(簡稱混元DiT模型)的加速庫。據騰訊介紹,這款加速庫可以顯著提升推理效率,使得生圖時間縮短了高達75%。
此外,混元DiT模型的使用門檻也得到了大幅降低。現在,用戶可以借助ComfyUI的直觀圖形界面,輕松利用騰訊混元文生圖模型的能力。混元DiT模型已經成功集成到Hugging Face的Diffusers通用模型庫中。這意味著,用戶現在只需三行代碼,就能直接調用混元DiT模型,而無需繁瑣地下載整個原始代碼庫,從而極大地簡化了使用流程。
ComfyUI,作為一款文生圖領域的WebUI界面設計工具,通過模塊化和圖形化的方式展示了文生圖領域的擴散算法。這不僅提高了生成效率與資源利用率,也顯著降低了開發者的使用難度。利用這個工具,用戶可以通過直觀的圖像化工作流來使用混元DiT文生圖模型,并且能夠達到與官方模型相同的效果。
另據ITBEAR科技資訊了解,圍繞ComfyUI的使用,已經形成了一個活躍的開源社區。混元DiT對ComfyUI的支持,無疑將進一步豐富這個社區的體驗,讓社區成員能夠嘗試到基于最新DiT架構的文生圖模型。
Hugging Face,作為知名的AI開源社區,其Diffusers庫已成為調用各種主流文生圖大模型的通用接口,并逐漸成為文生圖大模型使用的社區標準。
此前,騰訊已經宣布對其旗下的混元文生圖大模型進行了全面升級,并對外開放源代碼,供企業和個人開發者免費商用。這是業內首個采用中文原生的DiT架構的文生圖開源模型,它不僅支持中英文雙語輸入及理解,還采用了與sora一致的DiT架構。這意味著,它不僅可以用于文生圖,還可以作為視頻等多模態視覺生成的基礎。