圖片來源:由無界 AI生成
美圖自研大模型3.0,正式發布!
并且全面應用于美圖旗下影像與設計產品。
這是自美圖大模型面世100天后的最新迭代。
相較于最初版本,3.0版能夠生成更加真實細膩的畫面細節。
如上這些生成能力,在美圖秀秀上能直接體驗。
最近正流行的AIGC玩法,在其中都能找到。
美圖公司創始人、董事長兼CEO吳欣鴻透露,現在美圖大部分產品都融入了自研大模型。
除了影像和設計領域,美圖自研大模型還將在電商、廣告、游戲、動漫、影視五大行業發力。
美圖秀秀可直接體驗
美圖自研大模型名叫MiracleVision(奇想智能)。
其最顯著的特點是更懂美學。
美圖把長期積累的美學認知融入MiracleVision視覺大模型,并搭建了基于機器學習的美學評估系統,為模型生成結果打上“美學分數”,從而不斷地提升模型對美學的理解。
所以美圖也將自己的大模型稱為是“藝術生和理科生的結合”。
目前MiracleVision3.0的最新能力在美圖秀秀上即可體驗。
而且操作很簡單。比如涂鴉生圖,寥寥幾筆的草圖再加上提示詞,大模型都能“力挽狂瀾”。
更加專業、控制更多的體驗可以在AI視覺創作工具“WHEE”上體驗。
比如“圖生圖”功能里,可以通過智能聯想來生成完善的提示詞。
同時也能通過文字控制不希望呈現的內容。
更進一步可控制生成圖像風格。
以及可以通過參數調整、畫面控制能讓生成圖片更加符合自己的預期。
在提升工作流效率方面,美圖大模型MiracleVision現在進入了電商、游戲、動漫、廣告和影視五大領域。
從6月首次面世以來,MiracleVision經歷了三次迭代。
- 1.0版本主要初步構建大模型架構和基礎;
- 2.0版本聯合了設計師、藝術院校老師學生共同構建了高質量數據集,使得大模型在美學方面達到更好狀態;
- 3.0版本更強調模型的可控性,在細節和局部控制上做了提升,使得模型在技術層面達到更好效果。
目前,美圖AI視覺創作工具“WHEE”的AI效果生成數已超過550萬張,已初步打造設計師生態;AI口播視頻工具“開拍”月活躍用戶數已突破35萬;桌面端AI視頻編輯工具“WinkStudio”已累計服務近10萬名視頻創作者。
美圖吳欣鴻也表示,如今的美圖全員擁抱AI。隨著AIGC趨勢的發生,美圖有了更加明確的發展戰略。
比如快速推出自研大模型、布局五大行業,這些動作都基于美圖對于AIGC趨勢的理解和洞察。
上半年投3個億做研發
最明顯的一個方面,是美圖對于當下AIGC趨勢活躍用戶的理解。
吳欣鴻表示,他們觀察到如今離AIGC趨勢最近的人,不是設計師,而是“傳播者”。
以新媒體運營、電商運營和KOL為主的群體。
這部分人群沒有專業從業者的“包袱”和高要求,同時又能向下連接更多普通人。美圖目前的發力點之一就是抓住這部分人群,逐步開發更加完善的AI工具、構建工作流。
同時,美圖也認為自身在大模型趨勢下具備一個先天優勢——可以很快得到用戶反饋。
作為一家成立已有15年的產品公司,美圖已經構建起了足夠龐大的用戶群體,能夠通過在自身平臺上試水新功能,快速得到市場反饋并快速調整效果,這樣能讓大模型更高效地和實際場景結合起來。
作為AI能力的提供方,美圖吳欣鴻認為,目前AI視覺大模型在生產端的三個待解決的問題是:垂直領域的極致效果、工作流整合、變現能力。
一一對應來看,美圖在這三方面已開始發力。
其一,美圖快速迭代自研大模型,在100天時間里讓模型生成效果更加豐富且可控,能在滿足用戶新鮮體驗的基礎上,提供更加具有實用價值的圖像設計作品。
其二,美圖選擇了五大方向,面向生產者提供了AI設計工具。據透露,美圖選擇電商、游戲、動漫、廣告和影視這幾個行業,主要是看重了它們和互聯網行業有更加原生的關系。這使得AI工具能更好融入其工作鏈路,整合工作流速度更快。
其三,變現能力。美圖目前已經構建了一個創作者生態,這部分對AI感興趣的創作者,可以將自己原創的AI視覺效果做成配方,在美圖搭建的平臺上售賣。這樣一來,創作者能夠獲得更多收入,同時他們也能起到傳播推廣的作用,吸引更多人來使用AI視覺創作工具。
基于這些理解,今年美圖正式提出了AI產品形態,包括底層、中間層和應用層。
底層為MiracleVision自研大模型。
中間層由美圖AI開放平臺、美圖創意平臺、美圖AI助手RoboNeo組合而成,分別負責開放共享AI技術、搭建創作者生態、聚合美圖影像服務。
應用層由普通用戶更熟悉的各類應用App構成。
三層架構的搭建,根本邏輯還是為產品出發。
以底層研發為例,美圖旗下美圖影像研究院(MT Lab)早在2010年成立。目前公司大模型研發相關人員為600人左右。
今年上半年公司研發投入2.94億元,同比增長10.8%。
美圖坦言做研發是遵循更務實的邏輯,也就是看最終在用戶和收入增長方面,是否能帶來實際增長。而且這一切都自然都能通過實際業績來證明。
今年上半年,美圖公司實現總收入12.61億元,同比增長29.8%。月活躍用戶數達2.47億,同比增長2.5%。VIP會員數超720萬,創下歷史新高。以VIP訂閱為主的影像與設計產品業務收入6.02億元,同比增長62.2%;美業解決方案業務收入2.86億元,同比增長31.1%;廣告業務收入3.49億元,同比增長28.2%;其他業務收入2309萬元。
不過回到當下,美圖也坦言視覺大模型應用還正處在探索期。當下很多應用開發都是齊頭并進,各家也都在摸索路徑。
在吳欣鴻看來,視覺大模型應用普及將經歷三個階段:2024年之前為探索期,2024-2025年為高速發展期,2026-2030年為成熟期。
而想要成功穿越周期,不僅要有審視趨勢的能力,當然還要有真金白銀的支撐。
就以當下讓廠商們焦慮的算力問題,美圖透露目前正在和多家云廠商合作,有充足算力可以使用。
吳欣鴻更進一步補充,美圖“很幸運”能快速通過訂閱和單購獲得回報。
如果光投入不沒有回報,換誰都會緊張。但是對于我們來說,都還好。
我們的毛利也還好,所以都能cover掉。