來(lái)源:字母榜
在AI文生視頻這條熱門(mén)賽道,抖音旗下的剪映,正在被OpenAI的Sora越甩越遠(yuǎn)。
近日,美國(guó)軟件巨頭Adobe宣布,將在知名視頻編輯軟件Premiere Pro的新版本添加多款文生視頻AI工具。近兩個(gè)月震動(dòng)全球科技圈的Sora,以及兩款同類(lèi)產(chǎn)品Gen-2和Pika,都會(huì)在不久的將來(lái)加入“Adobe全家桶”。
有了Sora等第三方AI工具的助力,新版Premiere Pro除了編輯處理預(yù)先拍攝的常規(guī)視頻外,還能根據(jù)用戶輸入的文本即時(shí)生成AI視頻,并將兩者融為一體。
Adobe放出了一條官方演示視頻:一個(gè)男人走向窗前,觀看整個(gè)城市的夜景。用戶無(wú)需拍攝實(shí)景,只需輸入一段文字,即可利用Sora生成一段城市雨夜的視頻,并與前面的視頻無(wú)縫銜接,效果幾可亂真。
Sora今年2月初次亮相,OpenAI放出幾段演示視頻,但并未公布產(chǎn)品進(jìn)展和上線時(shí)間。如今,Sora被Adobe接納,表明過(guò)去幾個(gè)月又有不小進(jìn)步,距離開(kāi)放使用更近。
另一邊,背靠抖音的視頻剪輯軟件剪映,同樣朝著AIGC(人工智能生成內(nèi)容)方向前行。但截至目前,剪映尚未拿出令人驚艷的成績(jī)。
目前,剪映的AI玩法不少,包括一鍵成片、剪同款、AI克隆音色、數(shù)字人口播等,但并不具備根據(jù)文本直接生成視頻的能力。它的海外版本Capcut在2月底推出文生視頻功能,但效果距離Sora相去甚遠(yuǎn)。
如今,Sora除了在技術(shù)和產(chǎn)品上領(lǐng)先剪映,還得到了Adobe的青睞。Adobe在全球擁有超3300萬(wàn)付費(fèi)用戶;Sora接入“Adobe全家桶”,有望獲取訂閱收入分成,從而初步構(gòu)建商業(yè)模式。
這也意味著,仍在打磨AIGC能力的剪映,追趕Sora的難度將越來(lái)越大。
剪映被外界視為抖音搭上AIGC時(shí)代快車(chē)的關(guān)鍵籌碼。得益于抖音的加持,剪映已成為用戶量最大的手機(jī)視頻剪輯軟件之一,每天產(chǎn)出大量短視頻;在此基礎(chǔ)上更進(jìn)一步,從UGC(用戶生產(chǎn)內(nèi)容)邁向AIGC,似乎水到渠成。
今年2月7日,抖音功勛老將張楠辭去集團(tuán)CEO職務(wù),親自帶隊(duì)剪映。她在官宣職務(wù)變動(dòng)的內(nèi)部信中稱(chēng),AI圖像生成對(duì)她產(chǎn)生很大的觸動(dòng),潛力巨大,并決定“放下一切”,義無(wú)反顧地出發(fā)。
剪映的發(fā)展根基不可謂不好,抖音的重視程度也很高。但兩個(gè)多月過(guò)去,剪映依然沒(méi)有太大動(dòng)靜,Sora反而繼續(xù)高歌猛進(jìn)。
在AIGC時(shí)代,抖音及其背后的字節(jié),似乎總是棋慢一著。
字節(jié)八年前布局AI,成立了專(zhuān)門(mén)的實(shí)驗(yàn)室,招募大批業(yè)內(nèi)精英,但成果卻停留在內(nèi)容審核、自動(dòng)翻譯、搜索服務(wù)等。2022年下半年,ChatGPT引爆行業(yè);字節(jié)隨即增加大模型投入,一口氣推出AI聊天機(jī)器人等十幾款應(yīng)用,卻遲遲沒(méi)有拿出震動(dòng)行業(yè)的技術(shù)和產(chǎn)品。
今年1月底的年度全員會(huì)上,字節(jié)CEO梁汝波感嘆,字節(jié)“該有的大公司病全有了”。他特別點(diǎn)名AI業(yè)務(wù),稱(chēng):“公司層面的半年度技術(shù)回顧,直到2023年才開(kāi)始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的。”
如今,在立身之本的視頻內(nèi)容領(lǐng)域,OpenAI著著搶先,剪映乃至整個(gè)字節(jié)又雙叒慢了。
1
背靠抖音這顆大樹(shù),剪映原本有很大機(jī)會(huì)在AI文生視頻領(lǐng)域的占得先機(jī)。
剪映2019年上線,2021年推出PC端的專(zhuān)業(yè)版。它顯著拉低了UGC視頻的創(chuàng)作門(mén)檻,普通人只需準(zhǔn)備好素材、點(diǎn)擊幾下,就能生成一段質(zhì)量尚可的視頻,并一鍵發(fā)布至抖音。
此外,作為一款工具軟件,剪映還帶有一定的社區(qū)屬性。除了官方提供的視頻創(chuàng)作課堂外,用戶還可以參考達(dá)人制作的視頻模板進(jìn)行創(chuàng)作,也就是“剪同款”。這有助于提高用戶留存率和活躍度。
依靠豐富的功能,以及與抖音深度綁定,剪映僅用了三年就獲得超1億月活躍用戶,躍升至同類(lèi)軟件的第一名。
剪映海外版CapCut的增長(zhǎng)同樣驚人。
Capcut上線于2020年,與TikTok關(guān)聯(lián)密切。移動(dòng)應(yīng)用分析平臺(tái)點(diǎn)點(diǎn)數(shù)據(jù)顯示,目前Capcut的月活躍用戶超2億。另?yè)?jù)市場(chǎng)調(diào)研機(jī)構(gòu)data.ai的數(shù)據(jù),截至2023年8月,Capcut在iphone和Android/ target=_blank class=infotextkey>安卓端的用戶超4.9億,相當(dāng)于TikTok全球用戶量的1/4。
除了用戶規(guī)模龐大,剪映在AI領(lǐng)域的另一個(gè)優(yōu)勢(shì)是“近水樓臺(tái)先得月”,坐擁大量可用于AI大模型訓(xùn)練的視頻數(shù)據(jù)。
數(shù)據(jù)、算法和算力是AI大模型的三大基礎(chǔ)要素,其中數(shù)據(jù)是根基。要想提升大模型的綜合能力,就需要不斷“投喂”多模態(tài)數(shù)據(jù),主要是互聯(lián)網(wǎng)文本、圖像和視頻。
OpenAI、Adobe等公司都不直接掌握數(shù)據(jù),必須從第三方付費(fèi)獲取,成本不菲。據(jù)媒體報(bào)道,OpenAI每年僅采購(gòu)版權(quán)新聞文章授權(quán)的費(fèi)用,就高達(dá)100萬(wàn)~500萬(wàn)美元;Adobe為了訓(xùn)練自家的文生視頻大模型,以每分鐘3美元的價(jià)格,向另一個(gè)大模型服務(wù)Midjourney購(gòu)買(mǎi)視頻片段。
相比之下,剪映在國(guó)內(nèi)綁定抖音、在海外背靠TikTok,每天有大量用戶使用它剪輯和上傳視頻。這讓剪映能夠以相對(duì)低廉的成本,接觸到大量視頻內(nèi)容,為訓(xùn)練大模型、探索AI文生視頻功能打下基礎(chǔ)。
但從2019年至今,剪映并未研發(fā)出強(qiáng)大的AIGC能力,反而早早啟動(dòng)了商業(yè)化。
剪映很早就上線了VIP會(huì)員,用戶每月支付二三十塊錢(qián),可以使用專(zhuān)屬素材、精選模板等,AI玩法也被列為會(huì)員權(quán)益之一。根據(jù)官方介紹,AI玩法主要包括“無(wú)限創(chuàng)作”“無(wú)限運(yùn)鏡”和“瞬息宇宙”,基于現(xiàn)有視頻素材進(jìn)行AI美化編輯。
不難看出,剪映的AI玩法距離Sora這樣的文生視頻相去甚遠(yuǎn)。此外,它的收費(fèi)也并不低廉:會(huì)員每月可獲得1200積分,而使用一次“無(wú)限運(yùn)鏡”就需要480積分。積分耗盡后,用戶可以選擇繼續(xù)充值,兌換比例為1元:100積分。
剪映誕生之初的定位是,盡可能拉低短視頻創(chuàng)作門(mén)檻,促進(jìn)抖音UGC生態(tài)的繁榮。過(guò)去五年,它的確完成了這一任務(wù),大量抖音爆款視頻背后,都有剪映提供技術(shù)和模板。特別是那些趣味特效視頻、踩點(diǎn)視頻,抖音紅人發(fā)布之后,大量用戶迅速群起效仿、共同推高熱度;沒(méi)有剪映的幫忙,恐怕不易做到這一點(diǎn)。
但如今看來(lái),抖音還是把剪映的天花板設(shè)定地太低了。它原本有機(jī)會(huì)成為Sora這樣的劃時(shí)代產(chǎn)品,卻始終停留在視頻剪輯軟件的范疇。
今年以來(lái),剪映開(kāi)始奮起直追,但先機(jī)已失、對(duì)手已至,追趕難度也迅速增大。剪映被Sora甩開(kāi),字節(jié)在AI領(lǐng)域仍然沒(méi)能跳出“起大早、趕晚集”的怪圈。這也從側(cè)面印證了梁汝波此前批評(píng)的“平庸的重力”。
2
過(guò)度重視對(duì)業(yè)務(wù)的幫助,過(guò)早追求商業(yè)化,是剪映乃至整個(gè)字節(jié)AI板塊的難題。
剪映除了開(kāi)設(shè)付費(fèi)會(huì)員、將AI玩法納入權(quán)益包,還在App內(nèi)增加了不少?gòu)V告位。例如,用戶點(diǎn)擊“剪同款”,映入眼簾的除了手機(jī)照片和視頻素材,還有懸浮在素材上方、幾乎毫無(wú)關(guān)聯(lián)的橫幅廣告。
作為一款用戶破億的工具軟件,剪映的常規(guī)投入和資金壓力并不會(huì)特別大。它之所以早早發(fā)展會(huì)員和廣告,或許與字節(jié)的做事風(fēng)格和評(píng)判標(biāo)準(zhǔn)有關(guān)。
眾所周知,字節(jié)是一家超快節(jié)奏、高度內(nèi)卷的互聯(lián)網(wǎng)巨頭。如果個(gè)人、團(tuán)隊(duì)或業(yè)務(wù)無(wú)法迅速帶來(lái)肉眼可見(jiàn)的產(chǎn)出,就有可能被調(diào)整,甚至徹底出局。即使是需要長(zhǎng)期投入的AI,也無(wú)法跳出這一隱形的評(píng)判標(biāo)桿。
早在2016年,字節(jié)就設(shè)立了AI Lab人工智能實(shí)驗(yàn)室,并引入多位學(xué)界和行業(yè)精英。彼時(shí),OpenAI同樣初出茅廬,正朝著通用人工智能的愿景前行,將自己視為非營(yíng)利組織。
相比之下,AI Lab雖然名為“實(shí)驗(yàn)室”,實(shí)際上仍然需要密切配合和服務(wù)業(yè)務(wù)。它的官網(wǎng)宣稱(chēng),其研究重點(diǎn)是開(kāi)發(fā)為字節(jié)內(nèi)容平臺(tái)服務(wù)的新技術(shù);具體領(lǐng)域則包括自然語(yǔ)言處理、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)等,且和抖音各業(yè)務(wù)板塊貼合緊密。
隨后幾年,字節(jié)拿出了一系列AI工具,比如提供翻譯服務(wù)的Byte Translator,AI寫(xiě)稿機(jī)器人Xiaomingbot,以及頭條和抖音的搜索服務(wù)等。它們固然頗有價(jià)值,但算不上突破AI領(lǐng)域認(rèn)知邊界、定義AI發(fā)展范式的創(chuàng)新產(chǎn)品。
直到2022年下半年,OpenAI多年磨一劍,ChatGPT席卷全球,生成式AI成為全球科技公司競(jìng)逐焦點(diǎn),字節(jié)才把更多精力投入到這一新浪潮中。
已經(jīng)淡出字節(jié)一線管理的張一鳴,對(duì)AI產(chǎn)生強(qiáng)烈興趣,并鼓勵(lì)團(tuán)隊(duì)大舉投入。字節(jié)跳動(dòng)無(wú)法錯(cuò)過(guò)AGI(通用人工智能),它是抖音和TikTok在全球發(fā)現(xiàn)新的增長(zhǎng)機(jī)遇不可或缺的伙伴。
創(chuàng)始人發(fā)話后,字節(jié)各業(yè)務(wù)部門(mén)聞風(fēng)而動(dòng)。從那時(shí)起,字節(jié)陸續(xù)上線十多款A(yù)I產(chǎn)品,如豆包、話爐、扣子、Gauth等,剪映、飛書(shū)等也增添了AI功能。
但在這一輪大舉投入中,字節(jié)以業(yè)務(wù)需求為原點(diǎn)、對(duì)標(biāo)競(jìng)爭(zhēng)對(duì)手的做事邏輯被延續(xù)下來(lái)。豆包等產(chǎn)品均為現(xiàn)有AI技術(shù)的場(chǎng)景化應(yīng)用,而非對(duì)于AGI的原生探索。
例如,去年3月,微軟上線整合了GPT功能的365 Copilot,全球辦公軟件市場(chǎng)為之震動(dòng)。一個(gè)月后,飛書(shū)宣布即將上線AI助手“My AI”,以對(duì)話形式提供多種功能,包括優(yōu)化和續(xù)寫(xiě)文字內(nèi)容、創(chuàng)建日程、自動(dòng)匯總會(huì)議紀(jì)要、搜索公司內(nèi)部知識(shí)庫(kù)等。
一年后,GPT已經(jīng)在微軟“全家桶”遍地開(kāi)花,帶動(dòng)后者股價(jià)從250美元一路上漲至400美元以上。飛書(shū)卻沒(méi)能依靠My AI完成逆襲,反而在3月底宣布裁員。
又比如,Sora今年2月16日發(fā)布演示視頻,CapCut一周后就宣布推出這一功能,每人每天可免費(fèi)生成5段視頻。CapCut的技術(shù)力顯然無(wú)法與OpenAI比肩,其文生視頻功能也較為簡(jiǎn)陋;倉(cāng)促上線、對(duì)標(biāo)Sora,不免帶有蹭熱點(diǎn)、強(qiáng)行完成KPI的味道。
從張一鳴點(diǎn)名AGI至今,字節(jié)AI又走過(guò)了一年,并未顯著拉近與OpenAI的差距,甚至有擴(kuò)大的趨勢(shì)。字節(jié)AI向?qū)嵱弥髁x的過(guò)度傾斜,不僅讓它錯(cuò)失了以往的機(jī)遇,也有可能拖累追趕的步伐。
3
對(duì)于AI板塊各自為戰(zhàn)、圍繞業(yè)務(wù)打轉(zhuǎn)的局面及其危害,字節(jié)已經(jīng)有所察覺(jué)。
2023年11月,字節(jié)抽調(diào)多個(gè)部門(mén)的精兵強(qiáng)將,組建AI部門(mén)Flow。TikTok技術(shù)負(fù)責(zé)人朱文佳、字節(jié)產(chǎn)品與戰(zhàn)略副總裁朱駿、字節(jié)技術(shù)副總裁洪定坤、飛書(shū)產(chǎn)品副總裁齊俊元均加入其中。人員的“高配”,顯露了字節(jié)通過(guò)Flow統(tǒng)籌AI發(fā)展、消除重復(fù)建設(shè)的意圖。
目前,字節(jié)曝光度最高的AI產(chǎn)品——豆包、扣子、話爐等,均由Flow部門(mén)負(fù)責(zé)。剪映、飛書(shū)、大力教育等雖然也有AI業(yè)務(wù),但聲量已經(jīng)逐漸被Flow蓋過(guò)。
另一方面,字節(jié)云雀大模型已經(jīng)打磨近一年時(shí)間,多模態(tài)大模型BuboGPT也取得進(jìn)展,為Flow批量產(chǎn)出AI應(yīng)用奠定根基。假以時(shí)日,F(xiàn)low有望扭轉(zhuǎn)字節(jié)AI總是慢人一步的局面。
不過(guò),字節(jié)畢竟不是OpenAI,沒(méi)有微軟這樣的超級(jí)金主。AGI固然重要,但對(duì)于現(xiàn)有業(yè)務(wù)的拉動(dòng)尚不明顯,需要更長(zhǎng)時(shí)間的沉淀和打磨,才能釋放商業(yè)價(jià)值;字節(jié)對(duì)AGI的投入不可能無(wú)止境,必須考慮中短期的投入產(chǎn)出比。
短期來(lái)看,字節(jié)需要用錢(qián)、用人、用資源的地方很多,比如抖音貨架電商、生活服務(wù)等,都需要大量真金白銀。隨之而來(lái)的現(xiàn)象是,盡管Flow挑起了大梁,但字節(jié)AI依然呈現(xiàn)兼顧業(yè)務(wù)需求的傾向。
據(jù)Tech星球近日?qǐng)?bào)道,抖音生活服務(wù)剛剛成立一支AI團(tuán)隊(duì),希望利用AI技術(shù)創(chuàng)造增量業(yè)務(wù)價(jià)值,且已開(kāi)啟對(duì)相關(guān)AI產(chǎn)品的研發(fā),包括搭建生活服務(wù)相關(guān)的內(nèi)容創(chuàng)作平臺(tái)等。
抖音生活服務(wù)之所以拉起這樣一支隊(duì)伍,或許與競(jìng)爭(zhēng)對(duì)手美團(tuán)和餓了么的動(dòng)作有關(guān)。
美團(tuán)近日開(kāi)始小規(guī)模測(cè)試AI助手服務(wù)“問(wèn)小袋”,可為用戶推薦符合其需求的外賣(mài)商品,以及用餐建議。餓了么則在4月初面向零售行業(yè)商家發(fā)布“AI經(jīng)營(yíng)助手”,可為商家智能生成各類(lèi)經(jīng)營(yíng)關(guān)鍵報(bào)表和關(guān)鍵數(shù)據(jù)。
在此情況下,不讓美團(tuán)餓了么專(zhuān)美于前,或許是抖音生活服務(wù)入局AI的基本目標(biāo)之一。
內(nèi)外因素影響下,字節(jié)沒(méi)有條件像OpenAI那樣厚積薄發(fā)。既要追趕AGI潮流,又要具備快速落地、服務(wù)業(yè)務(wù)的能力,是字節(jié)AI的雙重目標(biāo)。
在張一鳴和梁汝波的督促下,外界無(wú)需質(zhì)疑字節(jié)做AI的決心。但倘若再過(guò)去一年、兩年,字節(jié)仍然跟不上OpenAI的節(jié)奏和水準(zhǔn),那么它或許應(yīng)該考慮另一種選擇:退回“賣(mài)水者”的角色,做AGI訓(xùn)練素材提供商。
如前所述,數(shù)據(jù)是大模型的三大基礎(chǔ)要素之一,而字節(jié)麾下的今日頭條、抖音、TikTok等,已經(jīng)積累了數(shù)以億計(jì)的文本、圖片和視頻。字節(jié)可以用這些數(shù)據(jù)訓(xùn)練自家大模型,也可以考慮更進(jìn)一步,在妥善解決安全和隱私問(wèn)題的前提下,將其出售給OpenAI等第三方公司。
充當(dāng)AGI時(shí)代的“賣(mài)水者”,其實(shí)是字節(jié)擅長(zhǎng)的流量生意的變體。字節(jié)如今的現(xiàn)金牛——廣告和電商業(yè)務(wù),都建立在流量變現(xiàn)的基礎(chǔ)上;如果把AI公司轉(zhuǎn)變?yōu)樾驴蛻?,那么字?jié)心心念念的第二增長(zhǎng)曲線問(wèn)題將迎刃而解。
另一方面,OpenAI既然能夠與微軟、Adobe合作,與字節(jié)合作也并非不可想象。畢竟,抖音和TikTok是Sora等AIGC服務(wù)最龐大的落地場(chǎng)景。倘若字節(jié)與OpenAI達(dá)成“競(jìng)合”關(guān)系,那么字節(jié)將跳出一步慢、步步慢的循環(huán),在OpenAI的助力下搭上AI快車(chē)。