“三個月前,MiracleVision繪畫水平還停留在初級階段。如今,3.0版本已經能描繪出真實細膩的畫面細節。”
繼今年6月19日正式推出視覺大模型MiracleVision后,10月9日,美圖公司創始人、董事長兼首席執行官吳欣鴻在美圖15周年生日會宣布,升級后的自研AI視覺大模型MiracleVision(奇想智能)3.0版本將正式投入應用。
現場,吳欣鴻將自己15歲的繪畫作品與面世100天的美圖視覺大模型生成作品進行了對比,他認為訓練AI與人類學畫有很多共通之處,通過充分學習不同的繪畫風格和技巧,AI將能創作出具有獨特性的原創作品。
在吳欣鴻看來,視覺大模型應用普及將經歷三個階段:2024年之前為探索期,2024-2025年為高速發展期,2026-2030年為成熟期,隨著視覺大模型在生產端的應用走向成熟,視覺大模型將助力千萬設計場景,引領美學的升級與社會經濟增長。
“垂直領域的極致效果、工作流整合、變現能力是目前AI視覺大模型在生產端的三個待解決的問題。但隨著AI視覺大模型和生產端的磨合,這三個問題會被逐步解決。”
他認為,AI視覺大模型的本質,是無窮無盡的視覺創意庫。“應用層相當于內容提取器,根據用戶的需求,從這個巨大的創意庫中提取所需要的內容,讓用戶在特定場景中使用。AI視覺大模型和應用之間相輔相成,大模型為應用提供技術支撐,應用反哺大模型的效果迭代。”
拆解大模型核心能力
據悉,通過加入“提示詞智能聯想”等新功能,MiracleVision3.0版本可降低大眾的使用門檻,并通過“提示詞精準控制”等功能來滿足更加專業的設計要求。并具備“深化創作”“AI畫面擴展”“局部修改”“分辨率提升”等專業功能。
具體來看,美圖將自研AI視覺大模型MiracleVision(奇想智能)的核心能力拆解為“奇思妙想”和“智能創作”兩大特性。
在“奇思妙想”層面,MiracleVision通過“提示詞智能聯想”功能降低大眾的使用門檻,當用戶輸入關鍵詞,MiracleVision可自動補充相關表述,如光影效果、質感、風格、圖片質量等,推動創作平權。此外,MiracleVision通過“提示詞精準控制”功能來滿足更加專業的設計要求,如使用“近景”、“遠景”、“順光”、“逆光”等描述控制最終生成效果。
在“智能創作”層面,MiracleVision通過“深化創作”功能,可以進一步豐富作品細節和提升表現力。通過“AI畫面擴展”功能讓作品尺寸更大、細節更豐富。通過“局部修改”功能,對部分畫面進行精準修改與調整。通過“分辨率提升”功能生成高清大圖,讓細節表現、色彩展示、物體辨識更加的精準和生動。
商用加速:五大行業將獲提效
據悉,此次公布的 MiracleVision3.0將全面應用于美圖旗下影像與設計產品。
與此同時,“MiracleVision將落地電商、廣告、游戲、動漫、影視五大行業,希望能幫助五大行業工作流提效。”吳欣鴻進一步介紹道,AI視覺大模型帶來的不僅僅是更好的視覺呈現,還有對工作流的效率提升,但目前大模型與工作流的結合仍在探索階段,抓住應用場景的核心需求更為重要。
在電商行業,從涂鴉生成線稿、線稿上色、商品圖、模特試穿圖,再到電商物料輸出,全程可通過MiracleVision實現;在廣告行業,MiracleVision覆蓋創意腦暴、創意深化、平面排版、多尺寸延展、線下投放預覽的全工作流,助力客戶在廣告物料制作環節提效。
在游戲行業,MiracleVision可以包攬場景設計、角色設計、道具設計、UI圖標、宣發物料等流程,拓寬設計師想象空間的同時助力游戲行業降本;在動漫行業,MiracleVision打通了概念設計、故事板生成、線稿上色、動漫補幀、視頻轉動漫等流程,支持創意到物料成品的快速落地。
而在影視行業,MiracleVision的高可控性可充分滿足概念場景設計、分鏡設計、人物造型、道具設計、宣發物料的效果要求,極大提升影視行業設計環節的效率。