兩秒鐘,就能將你的想象變成“現實”。
在商湯技術日上,商湯“日日新SenseNova”大模型體系正式問世,基于該體系的AI內容創作社區平臺“商湯秒畫SenseMirage”也一并亮相。
商湯科技董事長兼CEO徐立現場演示了“商湯秒畫SenseMirage”基于商湯自研AIGC模型的作畫能力;也介紹了秒畫平臺基于商湯大裝置的GPU算力支撐,可幫助用戶免除本地化部署流程,既能使用商湯自研作畫模型高效地生成高質量內容,也可以將本地模型及其他第三方開源模型一鍵導入,生成更多樣的內容。
秒畫還提供特異性推理優化服務,開源模型導入后會自動采用秒畫底層的模型編譯技術進行加速,實測在本地RTX3070顯卡需要10秒生成的圖片通過秒畫加速技術只需要2秒就可以生成。
此外,秒畫還支持用戶上傳本地圖像,結合商湯自研作畫模型或者開源模型來訓練定制化LoRA模型,來高效地生成個性化內容。(LoRA, 用于通過小數據繼續訓練,將大模型的能力適應到某個垂類領域,但會影響大模型的泛化能力)
·MHTeam: MiaoHua Team,商湯秒畫團隊創作模型
·最近創作:用戶使用商湯自研作畫模型最新創作并分享到廣場的圖畫作品
·精選模型:用戶可通過收藏,將商湯自研模型或開源模型添加至用戶“精選模型”列表中,方便需要時訪問和調用
·Civitai:是社區開源模型分享網站
·Hugging Face:為AI開源軟件公司,主要提供模型托管及GPU算力支持服務
“商湯秒畫SenseMirage”平臺,為各類創作者帶來便利,同時也能充分借助社區力量,集結內容創意,通過內容共創,推動AI文生圖技術與應用的生態構建。
超10億參數,多種風格秒生成
商湯自研的AIGC文生圖大模型擁有超10億參數,支持二次元、三次元等多種生成風格。用戶無需復雜的編程知識,只需給定提示詞,即可生成相應圖像,最高可實現6K高清圖。
無論是寫實照片、腦洞大開的藝術畫作,還是未來科幻場景,模型生成的圖像都能根據用戶需求,帶來真實的光影效果以及豐富的細節內容。憑借超快的推理性能,商湯自研作畫模型的文生圖能力,每2秒就能生成1張512*512分辨率的圖片。
自研AIGC模型,高效釋放圖像生成“巧實力”
相比于Stable Diffusion,商湯作畫大模型基于19年開始研發的通用大模型設計體系,采用更先進的大模型結構設計與大batch訓練優化算法,模型參數量大小為前者數倍。
核心技術包含了自研的 hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等算法,使其具備更優的文本理解泛化性、圖像生成風格廣度以及圖像高質量生成細節。
此外,目前市面上所有的LoRA模型都是基于Stable Diffusion或者其變體訓練的,依托商湯基模型本身強大的泛化能力,使用其替代Stable Diffusion模型可以基于更少量數據快速訓練出質量更高的LoRA模型,實現更優的風格定制化圖像生成,這樣的功能在秒畫平臺通過5分鐘即可實現。
模型導入+訓練,擺脫算力掣肘滿足進階創意需求
對于有進階需求的模型創作者, “商湯秒畫SenseMirage” 平臺也可支持自行上傳數據集進行finetune、自訓練等功能,定制訓練屬于自己風格的LoRA模型,通過拖拽20張圖片訓練集,僅需5分鐘就能完成訓練,顯著降低模型的訓練門檻。
同時,用戶也可以一鍵導入 Hugging Face, Civitai, GitHub 等第三方社區的開源模型進行體驗,讓用戶免除本地化部署的繁瑣流程,通過商湯AI大裝置SenseCore強大的GPU算力集群、推理加速功能,即可高效生成更多樣的內容,創作更便利。
不僅如此,商湯還將面向B端開放API接口,結合商湯AI大裝置SenseCore提供的算力,為客戶提供便利、高效的服務,打造多樣性的平臺和社區生態。
在大模型的驅動下,AI文生圖技術快速發展,可以廣泛應用于設計、營銷、游戲動畫、工程建筑、醫學、教育科普等領域,幫助人們提高創造力。
“商湯秒畫SenseMirage”平臺的推出,在為創作者打造低門檻、高效率的創作服務的同時,還能夠充分整合社區力量連接更多資源,帶來更加便利、完善的內容生產創作工具,讓每一位創作者都能輕松地將想象變為現實。