聲明:本文來自于微信公眾號AI新智能(ID:alpAIworks),作者:AI新智能,授權轉載發(fā)布。
什么,還必須要關注“技術”想要什么。
昨天凌晨,整個AI界發(fā)生了一場地震,在被視為“首屆AI春晚”的OpenA開發(fā)者大會上,GPT-4進行了史詩版本的更新。
128K的超長上下文、成本更低的tokens、全新的Assistants API、新增的多模態(tài)功能以及文本轉語音(TTS)技術,都讓新版的 GPT-4Turbo 模型變得性能更強大,同時也更具擴展性。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
然而,除了上述功能外,最令人驚艷的,莫過于GPT商店的問世。
CEO山姆·奧特曼現(xiàn)場登臺演示,全程不到3分鐘,無需任何編程操作,只需在對話框內告訴GPT自己的需求,一個“創(chuàng)業(yè)導師GPT”就應運而生。
是的,所有想實現(xiàn)的功能,都能通過聊天構建!
不僅如此,OpenAI還宣布,GPT商店將在本月晚一點的時候推出。
這意味著,任何人都能靠制作專屬GPT來賺錢了!
此言一出,網(wǎng)友即刻群起沸騰,并紛紛驚覺:AI的致富之路,真的對所有人敞開了!
那么,在這種百花齊放的應用生態(tài)中,AI時代的爆款應用,是否會就此誕生?而由此催生的應用生態(tài),又將打造怎樣龐大的市場?
1
如何建立壁壘?
自從互聯(lián)網(wǎng)時代以來,幾乎每一次技術的迭代,都會造就一批爆款。
而總結這些爆款的特征時,人們往往會發(fā)現(xiàn)如下的共同點:
它們不僅有長期的留存率,能構建商業(yè)模式,且有一定的護城河。雖然當時很難估算市場規(guī)模,但未來可能就是千億美金的公司,可遇不可求。
例如移動互聯(lián)網(wǎng)時代的抖音,就是個典型的例子。
而現(xiàn)在,GPT商店的推出,無疑為這類AI時代的“抖音”,提供了誕生的土壤。
然而,興奮過后,冷靜下來的人們也發(fā)現(xiàn)了個問題,那就是:在目前OpenAI打算構建的GPT商店 中,那一個個上架的應用,剛需點和壁壘究竟何在?
是的,無門檻的開發(fā),意味著人人都能上,可既然人人都能上,那誰又會為別人制作的GPT而付費呢?
大家想要什么功能,自己做不就完了嗎?
為了解開這一悖論,我們有必要對當前GPT商店所構建的這種UGC生態(tài),與前AI時代的UGC生態(tài)進行一個對比。
如果說,要想在前AI時代,為GPT商店的這種UGC模式,找一個最接近的例子,那恐怕最先入選的,就是以Roblox、蛋仔派對為代表的各種游戲類UGC社區(qū)。
在Roblox中,用戶可以使用平臺提供的易用的編輯工具,創(chuàng)建游戲場景、角色和道具,并將這些游戲資產發(fā)布到平臺上,供其他用戶玩耍、購買。
在這樣一種生態(tài)中,所有的玩家,都是基于同一個平臺或工具進行創(chuàng)作,誰也不會比誰擁有更多先天的、硬性的優(yōu)勢。
這樣的特點,與GPTs通過對話創(chuàng)建專屬GPT,從而抹平用戶創(chuàng)作門檻的做法,幾乎如出一轍。
而且由于“玩法”、“創(chuàng)意”之類的東西是抽象的,是依賴于用戶靈感,而非知識、技能的,因此在Roblox這類UGC社區(qū)中,所謂的“壁壘”從根本上說是沒有的。
可既然沒有壁壘,為何人們仍然愿意為其他玩家/用戶創(chuàng)作的內容付費?而不是自己創(chuàng)作?
其實原因很簡單,因為在這類UGC生態(tài)中,用戶創(chuàng)造的內容,是一種“易學難精”的東西。
換句話說,表面上看人人都可以創(chuàng)造,但精品的、高質量的內容,卻很難復制。
具體地說,在這類UGC社區(qū)中,用戶/玩家雖然可以使用游戲內的編輯器,創(chuàng)造出各種道具、地圖等虛擬物品,但真正受歡迎的、爆火的內容,往往需要付出很大的心血,或是需要天才的構思。
于是乎,最后懶得細細打磨的人,就會選購買別人創(chuàng)作好的、現(xiàn)成的游戲內容。
然而,盡管Roblox這樣的UGC模式,給將來GPT商店上的創(chuàng)作者提供了一個啟示,但它同樣有回答不了的問題,那就是:
Roblox這類平臺,終歸是個以娛樂為主的游戲平臺,而游戲是不講究“實用性”的,只要做得有趣,即可讓人掏錢。
但在GPT商店這種明顯帶有工具性、實用性的平臺上,各類基于GPT的應用,該怎么找到自己的“剛需”點呢?
2
“剛需”的誤區(qū)
很多人在討論大模型(LLM)與“剛需”問題時,往往會陷入一個誤區(qū):那就是以當下的、靜止的視角,來看待人們對LLM的需求。
實際上,如果用“剛需”的邏輯來看待當初的抖音、快手,那它們根本就不應該存在。
因為以當時的標準來看,它們根本就不“剛需”。
其實,所謂的需求,不是一成不變的,今天很多理所當然的“剛需”,也不是當時就產生的。
它本質上是一個隨著技術邏輯運動,而不斷發(fā)展的結果。
具體來說,抖音、小紅書這樣非工具性、非剛需的APP之所以會出現(xiàn)并爆火,本質上是移動互聯(lián)網(wǎng)技術邏輯的一種運動結果。
在移動互聯(lián)網(wǎng)的技術邏輯中,最重要的有兩點,一是便捷性,二是個性化。
便攜性,使得用戶可以隨時隨地訪問互聯(lián)網(wǎng),獲取信息。
這種情況下,用戶的時間變得更加碎片化了。在等待、通勤、休息等場景下,用戶希望利用碎片時間進行娛樂、學習或購物等活動。
于是,人們使用手機等移動設備的需求,開始變得越來越多樣了。那么,面對如此多樣的內容,用戶該如何選擇?
這時,推薦算法和大數(shù)據(jù)登場了。
移動互聯(lián)網(wǎng)的普及,使得用戶在移動設備上產生了大量的數(shù)據(jù),這些數(shù)據(jù)為推薦算法和大數(shù)據(jù)分析提供了豐富的數(shù)據(jù)來源。
通過對這些數(shù)據(jù)的分析,各大APP可以更好地了解用戶的興趣和需求,從而提供個性化的內容和推薦。
于是乎,在便攜性和個性化兩大技術邏輯的推動下,抖音、小紅書這些爆款APP就誕生了。
它們可以說是移動互聯(lián)網(wǎng)技術邏輯的一種終極體現(xiàn),必然結果。
由此可見,在分析某種新興技術是否能滿足“剛需”時,我們除了關注“人”想要什么,還必須要關注“技術”想要什么。
那么,按照這樣的邏輯,今天以ChatGPT為首的LLM,究竟想要什么呢?
從最近大半年LLM的發(fā)展趨勢,以及昨日OpenAI發(fā)布會的情況來看,目前的LLM,至少顯現(xiàn)出了兩大越來越明顯的傾向:
一是想“看”到和“聽”到更多,即多模態(tài)方向的發(fā)展;
二是想與更多的“同伴”協(xié)作,即智能體(Agent)方向的發(fā)展。
而這兩大愈發(fā)明顯的傾向,就構成了未來LLM發(fā)展的兩大技術邏輯——信息融合和自主決策。
信息融合,意味著LLM可以通過融合多種模態(tài)的信息(如視覺、聽覺等),實現(xiàn)對跨模態(tài)、跨領域任務的深入理解,從而更好地勝任不同場景的需求。
而自主決策,則通過多個智能體之間自動化的協(xié)作、配合,使LLM能實現(xiàn)在復雜環(huán)境、任務中的自主決策和行動,從而大大地解放了人類的時間、心智。
正如移動互聯(lián)網(wǎng)的誕生,催生了碎片化時間的場景一樣,上述兩大邏輯的演化和推進,也終將催生出一些人們從來沒見過的,新的場景與需求。
3
可能的應用形態(tài)
在自主決策和信息融合催生的新場景與需求中,最能代表其本質的,就最有可能產生新時代的“抖音”。
從上述技術邏輯的特點來看,至少有兩個方向的需求,可能性是最高的。
一是個性化的智能助理。
由于多模態(tài)技術的存在,這樣的智能助理,將很有可能脫離單一領域,或單一模態(tài)的限制,從而最大限度地深入人們的生活。
舉例來說,如果某人使用了某個翻譯類的GPT,那么該用戶也許在翻譯之外,還希望該應用兼具機票預訂的功能,幫跨境出行做好準備,又或是在此基礎上,成為一個智能的跨境電商的助手,對比不同國家、地區(qū)的商品。
第二個方向的需求,則是智能決策支持
如果一種技術,用與不用有很大區(qū)別時,它就會逐漸成為一種“剛需”。而智能決策,也許正在創(chuàng)造這樣的需求。
自動化的智能體系統(tǒng),最大的意義,不在于讓打工人每天節(jié)省那么幾個小時的時間,干些批量處理文檔之類的“牛馬活”,而在于其通過快速、高效和多角度的分析,為用戶提供“單一大腦”所難以得出的洞見。
例如,最近一家名為Fantsy的企業(yè),就用了類似于ChatGPT和Bard的機器學習技術,創(chuàng)建了一些具有詳細背景和思想、性格的智能體,讓它們在虛擬的小組中進行討論,從而對尚未發(fā)布的產品進行評估。
同樣的,類似的技術思路,也可以用于個人的財務規(guī)劃、職業(yè)規(guī)劃中,從而為個人在現(xiàn)實中的生活、工作,提供高質量的輔助決策。
綜上所述,GPT商店的出現(xiàn),雖然為各類AI應用的繁茂生長提供了土壤,但所謂“爆款應用”,卻并非完全靠人為的、主觀的“窮思竭慮”就能想出來的。
所謂爆款的誕生,本質上仍然要遵從技術發(fā)展的一般規(guī)律,唯有參透了這樣的規(guī)律,并在此基礎上思考、構建產品,才能長久地在智能時代扎下根脈。