來(lái)源:適道
圖片來(lái)源:由無(wú)界 AI生成
美國(guó)硅谷著名投資人,國(guó)際知名支付工具PayPal的創(chuàng)始人彼得·蒂爾(Peter Thiel)曾說(shuō)過(guò):“競(jìng)爭(zhēng)是留給輸家的。如果你想創(chuàng)造和獲取持久的價(jià)值,那就建立一個(gè)壟斷企業(yè)。”
這句話是對(duì)“贏家通吃”(Winner Takes All)的極致表述。“贏家通吃”指一種產(chǎn)品或服務(wù)只要比競(jìng)爭(zhēng)對(duì)手好一點(diǎn)點(diǎn)(例如1%),那么在該類別的產(chǎn)品或服務(wù)中,你就會(huì)獲得不成比例的巨大收入(例如90-100%),將競(jìng)爭(zhēng)對(duì)手遠(yuǎn)遠(yuǎn)拋在身后。
這個(gè)現(xiàn)象在很多行業(yè)都有所體現(xiàn),尤其是科技行業(yè)。從全球范圍看,IBM 在計(jì)算領(lǐng)域占據(jù)主導(dǎo)地位數(shù)十年;微軟主導(dǎo)個(gè)人電腦市場(chǎng);亞馬遜至今仍在單槍匹馬地統(tǒng)治電子商務(wù)領(lǐng)域。很顯然,互聯(lián)網(wǎng)時(shí)代的一大特征就是“贏家通吃,敗者恒弱”。
搞清楚這個(gè)問(wèn)題很重要,因?yàn)檫@將會(huì)改變我們的投資邏輯:如果傳統(tǒng)互聯(lián)網(wǎng)“燒錢補(bǔ)貼——干掉第二名——壟斷市場(chǎng)——發(fā)揮網(wǎng)絡(luò)效應(yīng)”的做法不再行得通,那么經(jīng)歷過(guò)“千團(tuán)大戰(zhàn)”時(shí)代的投資人,或許也需要一套新的投資方法論。
為了得到答案,適道投研團(tuán)隊(duì)參考了幾篇外網(wǎng)文章,作者包括A16Z合伙人Benedict Evans、美國(guó)光速創(chuàng)投(Lightspeed Venture Partners)合伙人Guru Chahal等人,試圖梳理出一些相近或相悖的觀點(diǎn),供大家思考。
會(huì)贏家通吃:代表方吳恩達(dá)
總體來(lái)看,吳恩達(dá) (Andrew Ng) 介紹的人工智能的良性循環(huán)模式為“贏家通吃”提供了底層邏輯。
最初,人工智能產(chǎn)品由有限的數(shù)據(jù)構(gòu)建。隨后,在與用戶接觸過(guò)程中,產(chǎn)品每天會(huì)收集越來(lái)越多的數(shù)據(jù)。而機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù)——大量的數(shù)據(jù)。
更多數(shù)據(jù)=更精確的模型=更好的產(chǎn)品=更多用戶=更多數(shù)據(jù)
這個(gè)良性循環(huán)公式被認(rèn)為是人工智能贏家通吃市場(chǎng)的一個(gè)重要因素。大數(shù)據(jù)和機(jī)器學(xué)習(xí)結(jié)合,放大了網(wǎng)絡(luò)效應(yīng)和規(guī)模回報(bào),再次強(qiáng)化了科技市場(chǎng)領(lǐng)導(dǎo)者的主導(dǎo)地位,意味那些已經(jīng)很大并且擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大。
就國(guó)內(nèi)情況來(lái)看,數(shù)據(jù)壁壘也是擺在新興公司面前的一堵墻。高質(zhì)量的中文語(yǔ)料數(shù)據(jù)對(duì)創(chuàng)業(yè)公司來(lái)說(shuō)是個(gè)很大的挑戰(zhàn),而數(shù)據(jù)的積累則需要時(shí)間和經(jīng)驗(yàn)。對(duì)于百度這樣常年累月通過(guò)搜索等多個(gè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)應(yīng)用積累起數(shù)據(jù)的公司來(lái)說(shuō),一開(kāi)始就領(lǐng)先了至少幾個(gè)身位。
不會(huì)贏家通吃:代表方A16Z
數(shù)據(jù)至關(guān)重要,但關(guān)于數(shù)據(jù)在實(shí)際工作中產(chǎn)生的作用,A16Z合伙人,著名分析師Benedict EvansDoes提出了不同的觀點(diǎn)。
EvansDoes在文章《AI make strong tech companies stronger?》中指出,雖然機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù),但是你使用的數(shù)據(jù)要非常適合你試圖解決的問(wèn)題。
通用電氣有大量來(lái)自燃?xì)鉁u輪機(jī)的遙測(cè)數(shù)據(jù),谷歌有大量搜索數(shù)據(jù),美國(guó)運(yùn)通有大量信用卡欺詐數(shù)據(jù)。但你不能用渦輪機(jī)數(shù)據(jù)來(lái)訓(xùn)練模型,去發(fā)現(xiàn)欺詐交易,也不能用網(wǎng)絡(luò)搜索數(shù)據(jù)訓(xùn)練模型去發(fā)現(xiàn)即將失效的燃?xì)鉁u輪機(jī)。
你訓(xùn)練的每一個(gè)模型只能做一件事。
這與之前的自動(dòng)化浪潮非常相似:就像洗衣機(jī)只能洗衣服,不能洗碗做飯,象棋程序不能交稅一樣,機(jī)器學(xué)習(xí)翻譯系統(tǒng)也不能識(shí)別貓。
你構(gòu)建的應(yīng)用程序和你需要的數(shù)據(jù)集,都與你試圖解決的任務(wù)強(qiáng)相關(guān)。(盡管這是一個(gè)不斷變化的目標(biāo),有研究試圖發(fā)現(xiàn)如何讓機(jī)器學(xué)習(xí)模型,在不同的數(shù)據(jù)集之間更容易遷移)。
這意味著谷歌會(huì)越來(lái)越擅長(zhǎng)成為谷歌,但不意味著它在其他方面也做得越來(lái)越好。
有的行業(yè)會(huì),有的行業(yè)不會(huì):需要看具體的垂直領(lǐng)域
那么,在垂直領(lǐng)域,頭部企業(yè)能否憑借遙遙領(lǐng)先的數(shù)據(jù)優(yōu)勢(shì),搶占全部市場(chǎng)?
EvansDoes認(rèn)為,情況會(huì)變得更加復(fù)雜。
比如誰(shuí)擁有數(shù)據(jù),數(shù)據(jù)有多獨(dú)特,數(shù)據(jù)在什么層面上是獨(dú)一無(wú)二的,以及聚合和分析數(shù)據(jù)的正確位置在哪里。這些問(wèn)題對(duì)于不同的業(yè)務(wù)部門、不同的行業(yè)和不同的用例,答案會(huì)有所不同。
我們假設(shè)一個(gè)場(chǎng)景,如果你正在創(chuàng)建一家公司來(lái)用機(jī)器學(xué)習(xí)解決現(xiàn)實(shí)世界的問(wèn)題,那么你會(huì)面臨兩個(gè)基本的數(shù)據(jù)問(wèn)題:
1、你如何獲得第一批數(shù)據(jù)來(lái)訓(xùn)練你的模型去獲得第一個(gè)客戶?
2、你需要多少數(shù)據(jù)?
第二個(gè)問(wèn)題可以分解成許多問(wèn)題:
你要用較少且容易獲得的數(shù)據(jù)來(lái)解決問(wèn)題?(但許多競(jìng)爭(zhēng)對(duì)手可以獲得) 。
還是你需要更多的、難以獲得的數(shù)據(jù)去解決問(wèn)題?
如果是這樣的話,是否存在一種網(wǎng)絡(luò)效應(yīng)可以從中受益?由一個(gè)贏家將獲得所有的數(shù)據(jù)?
產(chǎn)品是隨著更多的數(shù)據(jù)無(wú)限期地變得更好,還是存在一個(gè)S曲線?
這些都要看情況。
有些數(shù)據(jù),是企業(yè)或產(chǎn)品獨(dú)有的,或具有很強(qiáng)的專有優(yōu)勢(shì),例如通用公司的渦輪機(jī)遙測(cè)技術(shù)。但這對(duì)分析勞斯萊斯的渦輪機(jī),可能也沒(méi)有多大用處。
而一些數(shù)據(jù),可以用于許多公司甚至許多行業(yè)中的用例。許多創(chuàng)業(yè)公司也由此誕生,來(lái)解決許多公司或不同行業(yè)的共性問(wèn)題,并且這里的數(shù)據(jù)具有網(wǎng)絡(luò)效應(yīng)。
但也有這樣的情況,即在某個(gè)時(shí)間點(diǎn)之后,供應(yīng)商甚至不需要更多的數(shù)據(jù)了,因?yàn)楫a(chǎn)品已經(jīng)能夠工作了。
EvansDoes認(rèn)為,這種情況已經(jīng)在很多創(chuàng)業(yè)公司上演。例如, A16Z的投資的公司Everlaw開(kāi)發(fā)了一個(gè)法律軟件。該軟件能夠?qū)σ话偃f(wàn)封電子郵件進(jìn)行情感分析,就不需要以客戶的特定訴訟數(shù)據(jù)當(dāng)原料再進(jìn)行訓(xùn)練了。
更極端的情況是,一家大型車輛制造商正在通過(guò)模型訓(xùn)練,開(kāi)發(fā)更精確的爆胎檢測(cè)器。這是基于大量輪胎的數(shù)據(jù)訓(xùn)練出來(lái)的模型。但很顯然,這些數(shù)據(jù)的獲取難度并不高。
也就是說(shuō),機(jī)器學(xué)習(xí)的普及并不意味著谷歌變得更強(qiáng)大,而是意味著各種各樣的創(chuàng)業(yè)公司,能夠比以前更快地利用這一前沿技術(shù)來(lái)構(gòu)建一個(gè)應(yīng)用,解決一個(gè)問(wèn)題。
未來(lái)不會(huì)出現(xiàn)更多的“人工智能”創(chuàng)業(yè)公司,它們將是工業(yè)流程分析公司、法律平臺(tái)公司或銷售優(yōu)化公司。
EvansDoes將機(jī)器學(xué)習(xí)與SQL(Structured Query Language)進(jìn)行了類比。
在以前,如果你不使用SQL,你就會(huì)落后。例如沃爾瑪成功的一大因素,就是使用SQL更有效地管理庫(kù)存和物流。
但在今天,當(dāng)你創(chuàng)辦了一家零售公司,并說(shuō)“……我們將使用SQL”,這不會(huì)讓公司看起來(lái)更具價(jià)值,因?yàn)镾QL已經(jīng)成為了一切的一部分,然后它就在話語(yǔ)體系中消失了。
機(jī)器學(xué)習(xí)的未來(lái)也會(huì)如此。
“大模型”時(shí)代怎么投?至少互聯(lián)網(wǎng)邏輯確實(shí)行不通了
適道投研團(tuán)隊(duì)認(rèn)為,不管會(huì)不會(huì)“贏家通吃”,至少互聯(lián)網(wǎng)時(shí)代的投資邏輯在人工智能時(shí)代不再行得通。
核心邏輯在于,互聯(lián)網(wǎng)時(shí)代,“流量”是免費(fèi)的,這才有“網(wǎng)絡(luò)效應(yīng)”的概念:也就是說(shuō),在總的運(yùn)營(yíng)成本不變的情況下,用戶越多,網(wǎng)絡(luò)的價(jià)值就越大。這就是所謂的“所有行業(yè)都適合用互聯(lián)網(wǎng)思維重做一遍。”
但是,大模型時(shí)代不一樣的點(diǎn)在于,算力是有成本的。那么每多增加一個(gè)用戶,是要實(shí)打?qū)嵉馗冻鏊懔Γ⒉粫?huì)產(chǎn)生網(wǎng)絡(luò)效應(yīng),這就導(dǎo)致補(bǔ)貼沒(méi)有任何意義,你的新用戶越多,反而越賺不到錢。
另外,目前的大模型存在使用成本高、推理延遲較大、數(shù)據(jù)泄漏、專業(yè)任務(wù)上不夠準(zhǔn)確等問(wèn)題。與之相比,一些更小型、專業(yè)化(調(diào)整+精煉)的長(zhǎng)尾模型的優(yōu)點(diǎn)也顯現(xiàn)了出來(lái)。
因此,即便絕大多數(shù)技術(shù)都能起到財(cái)富聚集的作用,人工智能巨頭也確實(shí)能聚集大量財(cái)富,但因?yàn)樗懔Τ杀荆约安荒苷加姓麄€(gè)市場(chǎng),財(cái)富總量也會(huì)變得有限。