文字、圖片、影像……自ChatGPT開啟新AI時代后,AIGC生態就以前所未有的速度成長,而AI繪畫作為AICG領域C端應用最耀眼的存在,是否真的已經完成從繪畫工具到靈魂畫手的轉變?
011
狂飆猛進的AI繪畫
從“如何才能體驗AI繪畫工具”到“我應該選擇哪款AI繪畫”,AI僅用不到兩年時間就讓國內網友陷入選擇困難。一方面,百度文心一格、阿里云通義萬相等含著金鑰匙出生的AI畫師依靠巨頭大模型生態順利進入用戶視野,另一方面,美圖秀秀、盜夢師等工具類軟件融入AI后憑借差異化贏得不少網友青睞,AI繪畫徹底進入百家爭鳴的時代。
AI繪畫技術的持續地推動整個終端應用市場繁榮,而OpenAI團隊來源的深度學習模型 CLIP(Contrastive Language-Image Pre-Training)可以說是推動AI繪畫走向繁榮的契機。借助網絡,CLIP模型搜刮了40億個“文字-圖像”訓練數據,通過這天量的數據,再砸入讓人咂舌的昂貴訓練時間,CLIP模型終于修成正果,大眾首先熟知的AI繪畫產品Disco Diffusion,正是第一個基于CLIP + Diffusion模型的實用化AI繪畫產品。
OpenAI可以說是AI繪畫領域重要“推手”
然而,Disco Diffusion雖在畫作上給人顛覆性視覺體驗,但其模型在像素空間中進行計算,這會導致對計算時間和內存資源的巨大需求,這給予AI繪畫模型Stable Diffusion、MidJourney們崛起的機會,加上同一時期OpenAI團隊也推出DALL-E 2,較低的硬件需求和較短的繪畫時間開始讓AI繪畫在大眾領域傳播,即便沒有任何繪畫基礎的人,也可以通過幾句話的描述讓AI幫助自己“創作”出精美的畫作,進而讓AI繪畫真正成為AIGC時代的現象級應用。
021
從工具到社交的野心
巨大的研發投入和運維成本只為吸引更多的用戶流量,再通過用戶付費實現盈利?顯然低估了AI繪畫門的野心。
AI繪畫最初的定位是生產力工具,他們不僅可以提供基本的繪畫功能,適合初學者練習和探索,更可以在動漫設計、游戲場景創作等場景中,通過智能的AI算法為設計師自動匹配出優秀的配色設置構圖方案,讓設計師汲取靈感的同時,完成基礎的底層構圖工作,通過生產力屬性創造價值。
而隨著互聯網科技巨頭大模型的介入,AI繪畫逐漸從生產力工具向平臺發展。巨頭旗下的AI繪畫產品而相比于其他文生圖大模型產品,往往除了可以提供文生圖模型,更重要的是能夠基于平臺的算力、推理加速能力以及眾多開源模型,去幫助用戶更方便和快速地翻訓自己的垂類模型。定位“平臺”的AI繪畫應用不僅僅可以提供文生圖模型,往往還自帶一套算法框架,用戶可以直接在平臺上去訓練自己的模型,而不需要另外在本地部署環境,大大降低門檻,成為AI繪畫發展過程中的重要階段。
模型訓練讓人人都能擁有屬于自己的繪畫“大模型”
平臺的構建,意味著一個普通人也可以更快更好地訓練自己想要的垂類大模型。用戶只要用10至20張的照片放入到自己新建的模型中,AI繪畫平臺大概只需要幾分鐘的時間就可以生成一個能夠生成一個屬于用戶的大模型。這個過程中沒有任何代碼編寫、數據清洗等等以前只有AI工程師需要做的工作。只需要選擇模型,拖拽數據,就可以實現最終的結果。
平臺化的AI繪畫工具足以令AIGC領域開啟新一輪爆炸式增長,而隨著用戶模型及作品的涌現,平臺化的AI工具也能衍生為模型或內容社區,在授權、交互、共享模型數據的過程中,構建大模型翻訓鏈。比如,A是一個開源基礎模型,B是在A的基礎上加上一些垂類數據訓練出了一個在跳舞方面更專業效果更好的垂類模型,C又在B的基礎上增加了唱歌等數據訓練出新的不同模型。AI繪畫模型所搭建的平臺最終希望做到的是,將模型訓練依賴鏈條進行明確,方便每一個大模型擁有者進行翻訓,也方便大家管理自己的大模型上下游應用。
在整個平臺化、社區化發展過程中,AI繪畫背后的互聯網科技巨頭不僅能成為技術、數據的“賣水人”,更能在上下游模型權限的清晰界定以及涉及商業數據的存放等領域掌握足夠的話語權,幫助平臺、社區用戶實現內容變現的過程中,分享整個AI繪畫生態成長紅利。而在這之前,互聯網科技巨頭首先要解決的依舊是AI繪畫的基建工作,無論是大模型的研發還是訓練,都是資金、技術密集型投入項目,這也決定了AI繪畫未來可能僅是少數巨頭的狩獵場。
031
AI繪畫“錢”途如何
原畫、概設、氛圍參考……AI繪畫越來越多被游戲、動漫甚至教育等領域,除快速生成畫作之外,“AI作畫能否取代人類創作者”的話題也引發熱議,在社交平臺話題#一張畫證明人不會被AI取代#中,網友們發表了不少充滿想象力的畫作來證明人勝過AI。
相對于創意,AI生產力屬性創造的價值才是其備受追捧的關鍵。以國外較具有代表性的三家AI繪畫公司--Midjourney、Stability Al、OpenAl為例,三家公司的單次生成費用,不超過0.3元人民幣。而這三毛錢的費用,可以讓用戶次生成最少4張圖片。以Midiournev公開的試用模式為例,25分鐘的免費GPU時間,可以大致支撐25次免費生成。也就是說,AI繪畫1分鐘出1張圖,向用戶收不到毛錢,且可以用于商用。
這樣的出圖速度,人工是難以企及的 。據業內人士透露,某游戲公司將皮膚繪制的工作外包出去,每張稿費五六千元,畫師需要畫一個星期。而在小紅書上,兼職畫手出單張原創頭像,從接單、出初稿到修改,也需要兩三天的時間。
AI繪畫背后其實是算力、算法的比拼
AI繪畫也并非完全沒有劣勢,大模型是AI繪畫的核心競爭力,可大模型背后的研發成本和投資回報比率的風險,并非所有公司都可以承擔。OpenAI1750億參數的GPT-3耗費了大約500萬美元的訓練資金。
據Stability AI的公開數據,維護一個擁有4000塊英偉達A100 gpu組成的算力群,需花費超5000萬美元。同時高投入并不一定能夠帶來成果上的高回報,而在研發成本之外,每生成一張圖也需要相應的運行成本。百度文心一格團隊表示,AI繪畫是一個超大規模的復雜計算過程,需要大量的資源來支撐計算需求。AI繪畫依賴顯卡的算力,生成圖片的復雜度和精度越高,顯卡運算的時間越長,而一張高性能顯卡在云平臺的租賃價格在一小時15元左右。為了節省時間,用戶經常需要租賃多個顯卡并行運算,這導致AI繪畫的運算成本并不像想象中那么低廉。
從這里看,AI繪畫領域雖然前途似錦,但卻需要無數金錢和技術鋪墊,而在高談理想和未來之前,通過出色的繪畫能力俘獲用戶流量,沉淀大數據才是根本,而在最底層的“文生圖”應用上,各家AI繪畫又表現如何呢?