引言
繼去年中的擴(kuò)散生成模型(文字生成圖片)大熱后,今年的ChatGPT又火了,大家都想辦法繞過(guò)限制,注冊(cè)賬號(hào),親自體驗(yàn)。文字聊天玩膩了,就轉(zhuǎn)到文字生成圖片,圖片玩膩了,于是,升級(jí)成文字生成視頻,不亦樂(lè)乎。
《犬與少年》截圖
2023年1月31日?.NETflix宣布與小冰公司日本分部(rinna)、WIT STUDIO共同創(chuàng)作首部AIGC動(dòng)畫短片《犬與少年》,講述小孩與機(jī)器狗重逢的故事。
AIGC目前已成為全球熱點(diǎn),但多數(shù)仍停留在技術(shù)演示階段,普遍尚未實(shí)現(xiàn)作品級(jí)落地。《犬與少年》就成了AIGC技術(shù)輔助商業(yè)化動(dòng)畫片的首支發(fā)行級(jí)別作品,為動(dòng)畫制作揭開新的未來(lái)。
那么,AIGC(AI自動(dòng)生成內(nèi)容)怎么就這么火呢?
AIGC風(fēng)口已到
OpenAI的輪番路演(diffusion+chatgpt)下,AIGC成了當(dāng)紅炸子雞,覆蓋文本,語(yǔ)音,圖像等等…
各個(gè)投資方躍躍欲試,生怕錯(cuò)過(guò)此次風(fēng)口。紅杉單獨(dú)發(fā)布了AIGC報(bào)告,描述藍(lán)圖顯示,AIGC包含了文本、語(yǔ)音、圖像、視頻、3D等方方面面。
AIGC產(chǎn)業(yè)藍(lán)圖
比爾蓋茨一聲令下,微軟開始 all in chatgpt了
當(dāng)整個(gè)科技界對(duì)Web3和元宇宙的討論到最高點(diǎn)的時(shí)候,比爾蓋茨在美國(guó)社交新聞網(wǎng)站Reddit問(wèn)答帖下的親自回復(fù),引起了軒然大波。
“AI is the big one, Gates said in response to a user who asked if there is a mammoth shift in technology hAppening today. “I don't think Web3 was that big or that metaverse stuff alone was revolutionary but AI is quite revolutionary.”
“Web3沒那么重要,元宇宙沒革命性,人工智能最重要。”
ChatGPT火了
近幾年,GPT模型經(jīng)過(guò)了多次蛻變,一代比一代強(qiáng)(詳見文末的技術(shù)博客)。2022年11月,在GPT 3.5+RLHF(基于人工反饋的強(qiáng)化學(xué)習(xí))結(jié)合下,ChatGPT正式誕生。2023年,GPT 4即將誕生。迭代速度之快,讓人應(yīng)接不暇。
GPT系列演變史
短短兩個(gè)月時(shí)間,ChatGPT已經(jīng)衍生出一系列創(chuàng)業(yè)生態(tài),比如賣賬號(hào)(淘寶一堆店鋪),小程序(掙廣告費(fèi)),寫手,短視頻…全網(wǎng)都在討論ChatGPT。
說(shuō)不定ChatGPT真的變成AI屆的html,必備的基礎(chǔ)工具
ChatGPT持續(xù)進(jìn)化
爆火后的chatGPT并沒有原地踏步,而是不斷變異。用戶發(fā)現(xiàn)chatGPT的“高情商”行為,迎合“老婆”故意說(shuō)2+5=8,chatGPT連夜迭代,增加了基于事實(shí)計(jì)算能力,在基本事實(shí)面前,“老婆”不再管用了。chatGPT已經(jīng)可以根據(jù)用戶反饋?zhàn)詣?dòng)修正答案了,雖然尚不支持中文運(yùn)算優(yōu)先級(jí),且有些拼接痕跡,似乎學(xué)到了標(biāo)注人員腦子里的規(guī)則。
改進(jìn)前的效果:“老婆”說(shuō)啥就是啥,2+5=?
改進(jìn)前
改進(jìn)后,兼顧高情商和高智商,變成了“那我祝您老婆每天都有好心情!不過(guò),就數(shù)學(xué)公式而言,2+2仍然等于4”
改進(jìn)后
不用再用對(duì)話系統(tǒng)里死板的意圖識(shí)別槽位抽取狀態(tài)機(jī)之類的軟規(guī)則了…可見,chatGPT已經(jīng)具備一定理解能力了
文生圖(擴(kuò)散模型)
2022年中,擴(kuò)散模型發(fā)布后,各大廠商(OpenAI的DALL-E、Stable Diffusion、百度文心等)推出的文字生成圖片產(chǎn)品,效果也讓人眼前一亮,紛紛跑過(guò)去體驗(yàn)text2image…
用戶只需輸入一行文本,描述需求,機(jī)器就能直接生成一張令人滿意的圖片。
(1) Fine, beautiful country fields, super wide angle, overlooking, morning by Makoto Shinkai.
(2) A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.
(3) Fairy tale steam country by greg rutkowski and thomas kinkade Trending on artstation.
(4) A beautiful render of a magical building in a dreamy landscape by daniel merriam, soft lighting, 4k hd wallpaper, Trending on artstation and behance.
文升圖效果
AIGC為什么火
回到主題:AIGC為什么火?
技術(shù)上,傳統(tǒng)判別模型解決模式識(shí)別問(wèn)題(條件概率),理解能力有限,而生成模型(聯(lián)合概率)賦予了AI靈魂,開始從工具進(jìn)化到“人”,總算有點(diǎn)AGI的樣子了,不用再準(zhǔn)備數(shù)據(jù),根據(jù)下游任務(wù)finetune了…
《騰訊研究院AIGC發(fā)展趨勢(shì)報(bào)告》中提到:內(nèi)容創(chuàng)作模式的四個(gè)發(fā)展階段
(1)PGC:專家制作,2000年左右的web 1.0門戶網(wǎng)站時(shí)代,專業(yè)新聞機(jī)構(gòu)發(fā)文章
(2)UGC:用戶創(chuàng)作,2010年左右web 2.0時(shí)代(微博、人人之類),以及移動(dòng)互聯(lián)網(wǎng)時(shí)代(公眾號(hào)),用戶主導(dǎo)創(chuàng)作,專家審核
(3)AIUGC:用戶主要?jiǎng)?chuàng)作,機(jī)器(算法)輔助審核,如在抖音、頭條、公眾號(hào)上發(fā)視頻、文章,先通過(guò)算法預(yù)判,再人工復(fù)核,在成本與質(zhì)量中均衡
(4)AIGC:AI主導(dǎo)創(chuàng)作,以2022年底先后出現(xiàn)的擴(kuò)散模型、chatGPT為代表,創(chuàng)作過(guò)程中,幾乎不需要人工介入,只需一句話描述需求即可。
內(nèi)容創(chuàng)作模式
AI自動(dòng)生成內(nèi)容的方式實(shí)現(xiàn)了AI從感知到生成的躍遷。
目前AIGC處于技術(shù)成熟度曲線(gartner)爬坡期,gartner將AIGC列為2022年最有影響力的5大技術(shù)之一,2022年也被稱為AIGC元年。
2022年gartner曲線
算法上,過(guò)去幾年生成算法(VAE/GAN)、預(yù)訓(xùn)練模型(Transformer/GPT)、多模態(tài)技術(shù)(CLIP/DALL-E/擴(kuò)散模型)的不斷積累、融合,催生了AIGC的爆發(fā)
AIGC產(chǎn)業(yè)生態(tài)逐步成型
(1)基礎(chǔ)層:大廠地盤,涉及云計(jì)算(亞馬遜/微軟/谷歌)、GPU(英偉達(dá))、預(yù)訓(xùn)練(OpenAI/谷歌等)
(2)中間層:垂直場(chǎng)景,模型及服務(wù)(Model as a service)類公司(如stable diffusion)
(3)應(yīng)用層:C端消費(fèi)群體,聊天機(jī)器人,小程序,網(wǎng)頁(yè)接口等
應(yīng)用
本輪技術(shù)奇點(diǎn)過(guò)后,AIGC應(yīng)用能否大爆發(fā)呢?拭目以待。
附錄:
騰訊AIGC發(fā)展趨勢(shì)報(bào)告:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A
紅杉報(bào)告:https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/