來源:極客公園
大模型是短暫的風(fēng)口還是工業(yè)革命?是操作系統(tǒng)還是個人電腦?是原子彈還是Ak47?
自大模型去年強(qiáng)勢進(jìn)入人們的視野以來,人們在試圖理解大模型的過程中,不斷為大模型添加不同的比喻。
不同的創(chuàng)業(yè)者對此也有著不同的答案。
7月23日,在極客公園主辦的AGI Playground大會上,360集團(tuán)創(chuàng)始人,也是通過自研通用大模型"360智腦"親自下場,參與了本場大模型創(chuàng)業(yè)浪潮的周鴻祎給出了自己的答案。
周鴻祎一向以十分敢說而著名,本場演講中更是金句頻出:"創(chuàng)業(yè)需要把大模型拉下神壇。""不要等到大模型無所不能才開始做,只要想清楚了就可以開始干了。""在企業(yè)里面做大模型,我們要忘掉 ChatGPT 這個榜樣。"
周鴻祎在演講中表示,大模型是一場五到十年的風(fēng)口,有引發(fā)一場新的工業(yè)革命的潛質(zhì)。而大模型的未來絕對不像曼哈頓計劃,是尖端科學(xué)家和幾億人民幣才能訓(xùn)練出的原子彈,而一定像是AK47,價格便宜,火力足,分量夠。
而在周鴻祎眼中,創(chuàng)業(yè)者目前最好的"瞄準(zhǔn)技巧"就是面向B端市場。
周鴻祎談到,"現(xiàn)在創(chuàng)業(yè)者應(yīng)該做什么?做垂直大模型。我們講創(chuàng)業(yè)方法論,創(chuàng)業(yè)團(tuán)隊要算力沒算力,要錢也不夠多,要人才也不夠厚。跟這些巨頭競爭相比,你唯一的機(jī)會是把你所有的資源聚焦在一根針上,才能形成非常大的壓強(qiáng)。垂直大模型,是創(chuàng)業(yè)者的‘金光大道’。"
以下是周鴻祎在 AGI Playground 大會上的演講全文,經(jīng)極客公園節(jié)選整理:
大模型沒有壟斷
今天的演講題目叫"我的大模型產(chǎn)品方法論",是我自己的一些經(jīng)驗和體會。
最近有人開始唱衰大模型,但我覺得作為創(chuàng)業(yè)者,一定要站在現(xiàn)在看未來。如果站在現(xiàn)在看過去,我們能挑出大模型的很多毛病,但如果用發(fā)展的眼光來看,我相信大模型代表了未來一次工業(yè)革命的機(jī)會。
曾經(jīng)有人說風(fēng)口來的時候豬都在天上飛,我們也經(jīng)歷了AI、元宇宙、web3,但是我可以肯定:這次大模型不是風(fēng)口和泡沫。即使是風(fēng)口,我覺得這個風(fēng)怎么也得吹五年到十年。所以對在座的創(chuàng)業(yè)者來說,我覺得應(yīng)該還有十年的紅利期。
大模型有引發(fā)工業(yè)革命的潛質(zhì)。我們以電腦的發(fā)展為例:電腦在1946年被發(fā)明的時候,也沒有立刻引發(fā)工業(yè)革命。當(dāng)時,它只被氣象局、研究核物理的軍方等少數(shù)單位使用。電腦真正引發(fā)工業(yè)革命,應(yīng)該是比爾·蓋茨、喬布斯等人躬身入局,發(fā)明了個人電腦。雖然當(dāng)時大公司的人看不上個人電腦,但PC最大的好處就是每個人都用得起,每個公司都買得起。而且在通用的硬件架構(gòu)上加上不同軟件,就使得它能解決每個人生活工作中方方面面的問題,這才產(chǎn)生了電腦帶來的信息革命。
所以我認(rèn)為,大模型現(xiàn)在還很"高大上",我們的目標(biāo)是要把它拉下神壇。讓大模型真正的走進(jìn)千家萬戶,影響百行千業(yè),這才是大模型引發(fā)工業(yè)革命的道路。
作為行業(yè)里的先入局者,過去半年我們經(jīng)歷了3個過程:
第一個階段充滿了懷疑和震驚,第二階段是焦慮和等待——中國能不能也做出來大模型。我記得有投資人當(dāng)時認(rèn)為這是一件長期的工程,結(jié)果過了不到3個月,國內(nèi)很多大模型都面世了。很快,"孩子出生"不到三個月,投資人的期望已經(jīng)來到了第三個階段:大模型究竟能不能賺錢。所以今天,你發(fā)現(xiàn)沒有太多人去關(guān)注大模型的技術(shù),大家更關(guān)心大模型的產(chǎn)品化、場景化和商業(yè)化。
關(guān)于大模型,有一種說法是"大模型是操作系統(tǒng)",我覺得這是一種謬論。大模型的未來不會成為操作系統(tǒng),而是會成為個人電腦,成為數(shù)字化系統(tǒng)的標(biāo)配。因為操作系統(tǒng)往往是被大公司壟斷的,全世界不太可能有超過3套的操作系統(tǒng);而在今天,在座每個人的兜里都揣著一臺甚至更多臺"電腦"。
所以,我覺得大模型的發(fā)展路徑會更接近電腦的發(fā)展歷程。以后每個家庭、每個企業(yè)、每個政府部門可能都有至少一個或多個大模型。
最近蘋果已經(jīng)嘗試把大模型部署在個人電腦里,蘋果在嘗試讓大模型在電腦上跑起來,高通在嘗試讓大模型在手機(jī)跑起來。而在未來,我認(rèn)為大模型還會出現(xiàn)在每一臺智能汽車上,它不僅要解決智能座艙和交互控制的問題,甚至?xí)恼J(rèn)知層面解決自動駕駛和輔助駕駛的問題。
這是我今天一個非常極端的觀點,但這的確是我認(rèn)知的未來大模型在中國的發(fā)展之路:不會有壟斷,不會只有3-5個大模型,大模型將無處不在。
所以像OpenAI這樣,做一個極端的遙遙領(lǐng)先的大模型的商業(yè)模式,也許不一定是我們各位創(chuàng)業(yè)者喜歡的模式。只有市場可以完全的去中心化,并且切成非常多碎片,才會有創(chuàng)業(yè)者的機(jī)會。大模型剛出來的時候,有人把它描述為"曼哈頓計劃"。但如果這是"曼哈頓計劃",就沒有創(chuàng)業(yè)者的機(jī)會了。
ChatGPT剛出來的時候,我的人也很慌。我說慌什么,讓子彈再飛一會。因為我有兩個東西會有突破。第一,OpenAI做大之后,就會有很多人離職創(chuàng)業(yè)。很多的訓(xùn)練方法、訓(xùn)練技巧被慢慢會出來。第二,就像《讓子彈飛》的劇情里一樣,安卓當(dāng)初在追趕iOS的時候,用了一個方法就是開源。我覺得這種開源非常好,就像是AK47:價格便宜,火力足,分量夠,能夠?qū)崿F(xiàn)"科技平權(quán)"。
所以今天我們要感謝開源,感謝對大模型越來越開放的討論和公開,特別是Facebook(Meta)。我原來以為小扎(Meta 創(chuàng)始人扎克伯格)都陷入到元宇宙的泥潭里不能自拔,沒想到他們貢獻(xiàn)了LLaMa,LLaMa會讓很多公司不那么需要 OpenAI。
免費(fèi)的開源帶來了科技平權(quán),也降低了大模型的創(chuàng)業(yè)門檻。LLaMa開了這個先河,產(chǎn)生了寒武紀(jì)生物大爆炸的那樣的效果。
企業(yè)市場里的機(jī)會和痛點
我今天沒有能力給大家發(fā)AK47,但可以教授一些射擊的方法,也就是對于創(chuàng)業(yè)者來說,在大模型領(lǐng)域應(yīng)該關(guān)注什么市場?張鵬(極客公園創(chuàng)始人&總裁)把市場分為中心化和去中心化。如果把中心化理解為科技巨頭、互聯(lián)網(wǎng)平臺公司,那么在已有的業(yè)務(wù)上,它們用AI把握住現(xiàn)有的存量市場,那么這一塊不會有創(chuàng)業(yè)者大多的機(jī)會,除非別人做到60分,你能做到200分。
所以巨頭們,會把自己已有的場景,特別是to C的場景都占住。為什么騰訊不慌不忙?因為誰做出一個聊天機(jī)器人,最大的聊天場景都是在微信和 QQ 里;字節(jié)跳動也不慌不忙,如果將來它有一個大模型,在每個抖音場景里給你放一個,那不用都很難。
我覺得,巨頭一定會用全家桶的思路,把自己的全家桶產(chǎn)品裝上它們的大模型。用戶又很懶,很多用戶會就近使用。所以這個存量市場,或者叫中心化市場,我預(yù)估在未來在大模型市場里,很難有大的改變。
我覺得在80%去中心化的企業(yè)級市場,蘊(yùn)含著巨大的機(jī)會。也就是我剛才提到的,每個政府部門、每個行業(yè)、每個企業(yè)可能都需要結(jié)合自己業(yè)務(wù)使用的大模型。因為大模型就像一個發(fā)動機(jī),這些企業(yè)都關(guān)心怎么把發(fā)動機(jī)買來,放在自己造的"車"上,和現(xiàn)有的業(yè)務(wù)進(jìn)行緊密的結(jié)合。
張鵬前段時間去美國做了一系列調(diào)研。我這幾年也一直在轉(zhuǎn)型做 to B和數(shù)字安全,我發(fā)現(xiàn)我們的調(diào)研結(jié)果是一致的,就是很多企業(yè)對大模型非常神往,但是他們又有非常多的顧慮。大模型不是云計算,企業(yè)不會選擇直接接入大模型的API,通用大模型在企業(yè)級場景中沒辦法直接用。周鴻祎總結(jié)主要是以下幾個方面的問題:
第一個痛點:目前的大模型是萬事通,但不是行業(yè)通。如果你真的用過chatGPT,在震驚完它什么都會之后,你會發(fā)現(xiàn)一旦問它一些行業(yè)的問題,它就會說很多概念性的正確廢話。也就是說,ChatGPT對行業(yè)理解的深度還遠(yuǎn)遠(yuǎn)不足。
我經(jīng)常夸獎創(chuàng)業(yè)者,"你可能是一個天才,但你一定不是一個全才。"反過來,如果把自己定義成一個通才、全才,那么在某一個方面要想達(dá)到天才的深度,我認(rèn)為也是很難的。
第二個痛點:不懂企業(yè),不懂企業(yè)內(nèi)部的知識。而我們每個成功的企業(yè),都有點自己的"小九九",有點自己的know-how。比如說360,在數(shù)字安全方面積累了全球最多的攻擊樣本。我會愿意把這個貢獻(xiàn)給行業(yè)嗎?我會愿意把它訓(xùn)練到公有的大模型里嗎?不可能。所以這就形成了一個巨大的矛盾。即:企業(yè)有獨特的知識,希望能夠訓(xùn)到模型里面去,這樣這個模型才能更加的結(jié)合企業(yè)的業(yè)務(wù),但同時,企業(yè)又不愿意把這些知識放到公有云上去。
順道說一下,中國和美國的市場有很大的不一樣。在美國,基本上都是公有云的天下。哪怕IBM收購了紅帽公司Red Hat,但是私有云市場在美國還是不成氣候,甚至美國的很多軍方情報機(jī)構(gòu)都會接受和使用微軟或者亞馬遜的公有云。
但是在中國,你會發(fā)現(xiàn)我們的企業(yè)老板、政務(wù)部門對服務(wù)器的位置是非常在意的。所以在國內(nèi),混合云、專有云、私有云的市場,機(jī)會要比美國要大很多。
第三,存在數(shù)據(jù)安全隱患。三星曾經(jīng)犯過這個錯誤,360也給程序員開了 ChatGPT 的賬號,讓他們試用一下。還真有程序員,把剛寫的代碼整個上傳,讓 ChatGPT 給他看一下有沒有bug,這是不被允許的。
第四,大模型無法保證生成的內(nèi)容完全可信,或者說大模型能產(chǎn)生知識模糊、制造知識幻覺。我覺得這是既是優(yōu)點也是缺點。
對于一個幫助別人寫劇本、寫小說的大模型來說,能編出"林黛玉三打白骨精"、"賈寶玉倒拔垂楊柳"的故事,可以看成創(chuàng)造力的展現(xiàn)。因為在這個出現(xiàn)之前,世界上所有的動物只有人類會瞎編,我們每個創(chuàng)業(yè)者都要學(xué)會描繪不存在的事情來激勵自己的團(tuán)隊,這是產(chǎn)生意識和智力的基礎(chǔ)。大模型有了這種能力,讓我們看到它有機(jī)會產(chǎn)生真正的智能。
但問題是,在企業(yè)里面,如果這種不可信和企業(yè)的業(yè)務(wù)系統(tǒng)融合在一起,就可能產(chǎn)生悲劇的結(jié)果。舉個例子,如果有人要做一個中醫(yī)大模型,準(zhǔn)備把本草綱目、黃帝內(nèi)經(jīng)全部都灌進(jìn)去了。但是它給你開了一方子,敢不敢照方抓藥呢?怎么解決內(nèi)容不可信的問題,我覺得是一個非常大的挑戰(zhàn)。
幻覺問題是一個大模型的普遍問題,誰能解決幻覺問題,相當(dāng)于摘下了"皇冠上的明珠"。
目前看到有人在用向量數(shù)據(jù)庫解決,其他的解決方案還包括使用企業(yè)全文檢索,企業(yè)外部數(shù)據(jù)庫,但即使這樣,你會發(fā)現(xiàn)它依然不能全部解決這一問題,所以我們也在研究如何訓(xùn)練一個大模型,來保證大模型的內(nèi)容輸出。
第五,大模型的模型訓(xùn)練和部署,現(xiàn)在的普通企業(yè)無法承擔(dān)。傳說OpenAI訓(xùn)練一次GPT-4,需要2000萬美元的成本。中國什么樣的客戶能承受這樣的價格?所以,如果不把大模型拉下神壇,讓它像 PC 一樣變得簡單好用、成本低廉,企業(yè)是很難接受的。就算有一些企業(yè)和單位現(xiàn)階段買得起大模型,它也雇不起訓(xùn)練大模型的人——現(xiàn)在訓(xùn)練大模型的人比大模型還要貴。
最后一個問題,無法保證大模型的所有權(quán)。我們的企業(yè)和政府,對所有權(quán)都非常在意,因為大模型一旦把企業(yè)的核心知識訓(xùn)進(jìn)去了,它的安全性、重要性就無比重要。把中石化的數(shù)據(jù)拿到,然后去給中石油服務(wù),或者把協(xié)和醫(yī)院的數(shù)據(jù)拿到,去給301醫(yī)院服務(wù)是不現(xiàn)實的。to B和to C的市場完全不一樣。
另外,我們要考慮國家對大模型的政策法規(guī)對創(chuàng)業(yè)的影響。我覺得國家大戰(zhàn)略是產(chǎn)業(yè)數(shù)字化。互聯(lián)網(wǎng)企業(yè)要甘當(dāng)配角,把數(shù)字化能力和大模型能力賦能傳統(tǒng)企業(yè),特別是制造業(yè),幫助他們實現(xiàn)數(shù)字化、智能化,這個方向國家是絕對贊成和支持的。
我們講順勢而為,用大模型給中國的產(chǎn)業(yè)數(shù)字化做賦能,是符合國家大戰(zhàn)略的,就是順勢而為。
網(wǎng)信辦近期公布了一個《生成式人工智能服務(wù)管理暫行辦法》,它明確了如果你是為企業(yè)、行業(yè)提供生產(chǎn)力的工具服務(wù),數(shù)字化轉(zhuǎn)型的賦能服務(wù),用大模型給中國的產(chǎn)業(yè)數(shù)字化做賦能,國家是支持的,這對我們很多做to B、To G的創(chuàng)業(yè)者來說是一個非常好的消息。
在我和極客公園張鵬討論的時候,我們談到會不會有行業(yè)大模型的機(jī)會。對這個問題,我現(xiàn)在還處于思考之中,我覺得行業(yè)大模型可能是一個幻覺。不會出現(xiàn)公有服務(wù)的行業(yè)大模型,但很多企業(yè)仍然會做私有的行業(yè)大模型。
可以想象一下,我是一家醫(yī)院,我有無數(shù)的病例知識做訓(xùn)練,訓(xùn)練結(jié)束后我會一定拿這個醫(yī)療大模型加強(qiáng)我的行業(yè)競爭力,但我不會把它開放出去共享給其他醫(yī)院,所以做公有的行業(yè)大模型的機(jī)會是不是存在?我們打一個問號,這也是值得各位創(chuàng)業(yè)者去思考的問題。
創(chuàng)業(yè)者的機(jī)會:垂直大模型的六大方向
所以從前面這些,我們推出一個結(jié)論,現(xiàn)在創(chuàng)業(yè)者應(yīng)該做什么?做垂直大模型。
我們講創(chuàng)業(yè)方法論,創(chuàng)業(yè)團(tuán)隊要算力沒算力,要錢也不夠多,要人才也不夠厚。跟這些巨頭競爭相比,你唯一的機(jī)會是把你所有的資源聚焦在一根針上,才能形成非常大的壓強(qiáng)。
垂直大模型,是創(chuàng)業(yè)者的金光大道。
我認(rèn)為在這個下面,有六個垂直的趨勢:行業(yè)垂直化、企業(yè)垂直化、專業(yè)垂直化、小型垂直化、分布式垂直化、專有垂直化。
第一個是行業(yè)垂直化,即在通用大模型的基礎(chǔ)之上,做行業(yè)數(shù)據(jù)的訓(xùn)練。這就像你把一個本科生訓(xùn)練成研究生或者博士生。我最近剛考上博士生,博士生都是在特別專、特別垂直的領(lǐng)域里培養(yǎng),要這樣才能在某個領(lǐng)域有所突破。
第二個是企業(yè)垂直化。做大模型一定要跟某個企業(yè)的技術(shù)訣竅、商業(yè)秘密的知識管理緊密地融合在一起。
第三個,也是非常重要的,是專業(yè)垂直化。在企業(yè)里面,我覺得從訓(xùn)練的難度來說,最好是用一個模型解決一類問題。
ChatGPT 給了大家一個幻覺,覺得應(yīng)該用一個模型解決所有的問題,實際上如果大家訓(xùn)練過大模型就會知道,它跟人非常像,會出現(xiàn)學(xué)物理學(xué)多了,數(shù)學(xué)能力就有點下降的問題。
大家對 GPT-4 為什么這么強(qiáng)有一個猜測,說是它不是一個大模型,而是由 8 個專業(yè)模型共同支持的,一個模型解數(shù)學(xué),一個模型解編程,一個模型定安全,我認(rèn)為這種猜測是合理的。
事實上,在企業(yè)信息化管理上,到今天也沒有一個統(tǒng)一的業(yè)務(wù)系統(tǒng)。 HR 有 HR 的管理系統(tǒng), 管理客戶有 CRM 管理系統(tǒng),管理生產(chǎn)有ERP管理系統(tǒng),不會用一個業(yè)務(wù)系統(tǒng)去做。
如果我們把大模型看低一點,它就是企業(yè)業(yè)務(wù)系統(tǒng)的智能化的升級。那么企業(yè)業(yè)務(wù)系統(tǒng)現(xiàn)在分成很多垂直的部分,那么大模型也應(yīng)該做到專業(yè)垂直。
第四是小型垂直化。現(xiàn)在的趨勢, GPT-5 號稱據(jù)說要往 100 萬億的參數(shù)做,那需要一臺超級電腦進(jìn)行支持,據(jù)說英偉達(dá)一年的顯卡供給它用都不夠,這個肯定不是我們創(chuàng)業(yè)者該走的道路。
那么現(xiàn)在還有一個趨勢,是 LLaMa 的生態(tài)里有一家公司專門研究怎么往邊緣設(shè)備上部署 LLaMa,模型小型化其實是OpenAI這種模式的逆向操作。小型化之后雖然能力會降低,但是我給企業(yè)做一個大模型,專門解決企業(yè)文書寫作的問題,需要會唱歌嗎?需要會解奧數(shù)題嗎?事實上奧數(shù)題也就是這些國內(nèi)的大模型,用來互相攻擊對手的一種測試案例,在生活中使用的都非常少,在企業(yè)市場里,使用的場景更是非常少。
王小川的百川智能和 LLaMa 都做了 7B(70 億參數(shù)) 的模型,還做了 13B (130 億參數(shù))的模型,它為什么要做這樣的參數(shù)?因為小模型無論是訓(xùn)練、部署還是調(diào)試,成本都特別低。可能,比如說你用大概 80張A100(英偉達(dá) GPU 產(chǎn)品)能夠調(diào)試一個百億的模型,這對很多企業(yè)的來講成本就非常低。
第五個是分布式垂直化,就是將來在企業(yè)里面云管邊端結(jié)合部署,既可以在云端也可以在終端上部署。
第六個是專有垂直化,或者叫私有垂直化,私有化的部署保證安全可控。
所以在企業(yè)里面做大模型,我們要忘掉 ChatGPT 這個榜樣。ChatGPT 在C端使用,從奧數(shù)到物理,從天文到地理,從醫(yī)療到法律,無所不能。
你的目標(biāo)如果是打造一個天才,那我覺得這個挑戰(zhàn)會非常難,但是我們在企業(yè)里,通常雇不到也雇不起天才,常見的方法是用管培生——受過通識教育的優(yōu)秀本科生,根據(jù)公司業(yè)務(wù)進(jìn)行專門的培養(yǎng)。所以企業(yè)里面不一定需要GPT4 這樣的全才、通才或者天才,而是需要有垂直領(lǐng)域經(jīng)驗和技能的人才,這就是我們垂直模型要干的事情。
我還有一個觀點,我覺得創(chuàng)業(yè)者現(xiàn)在就能立即行動起來,我們不需要等到大模型無所不能,等到它超越了 GPT-4的能力之后才開始做。只要想清楚了產(chǎn)品應(yīng)用的場景,現(xiàn)在就能做。因為我們劃定的這個企業(yè)化、行業(yè)化、垂直化、專業(yè)化的一個市場,今天你只要達(dá)到 GPT-4 的 70 分或者 80 分,我認(rèn)為就夠用了,所以對創(chuàng)業(yè)者的要求也降低了很多。
最后誰能成功,我覺得就看誰能先找到場景,快速行動, first move,just do it。
創(chuàng)業(yè)實戰(zhàn):用最成熟的能力尋找小切口,解決用戶痛點
最后簡單分享一些我們關(guān)于如何讓大模型在企業(yè)去落地的實戰(zhàn)的想法。
第一個,雖然大模型無所不能,我建議大家仔細(xì)的把大模型的能力好好做一個篩選,把它最通用的、最成熟的能力先拿出來。
你像現(xiàn)在有很多人很癡迷于研究 agent 模式,就是代理模式,但是這是國外最前沿的研究。用大模型來做規(guī)劃,為什么干著干不下去了?規(guī)劃不穩(wěn)定,有時會陷入死循環(huán),而且讓大模型做規(guī)劃,控制資源還有很多安全問題。
我覺得大模型最常用的功能只有兩個:一個是知識問答,一個是寫作生成。所以我覺得應(yīng)該先把大模型這兩個功能找到各種細(xì)化的垂直場景應(yīng)用。
第二個,要選擇用戶的痛點和剛需切入,"小切口、大縱深"。實際上目前討論大模型跟生產(chǎn)業(yè)務(wù)系統(tǒng)連接的,我認(rèn)為現(xiàn)在都是浪漫主義行為,我非常的不贊同。我的建議還是先回到辦公的場景。我把它劃分為四個需求:上下內(nèi)外。
對上,就是對領(lǐng)導(dǎo),需求有信息決策、輿情分析。對下就是對普通員工來說,需求包括企業(yè)的知識搜索、知識管理和新員工培訓(xùn)。
對內(nèi),需求有辦公協(xié)作,辦公生成。對外,智能客服。這些目前的場景都是企業(yè)客戶比較能接受的,也是大模型比較擅長的。
第三個,這個觀點會很有爭議,一些創(chuàng)業(yè)者希望用大模型來做主駕駛驅(qū)動業(yè)務(wù)系統(tǒng)。我倒是跟客戶都這么講,大模型不是萬能的,那么你現(xiàn)在的很多業(yè)務(wù)系統(tǒng)是不能被取代的。創(chuàng)業(yè)者千萬不要介入舊系統(tǒng)的改造之中,陷入其中可能長期無法交付。
大模型要跟現(xiàn)有的系統(tǒng)做一定的隔離,盡量少發(fā)生 API,函數(shù)調(diào)用的聯(lián)系,它們看起來很強(qiáng)大,但和已有業(yè)務(wù)融合在一起很難交付。做一個相對獨立的人工智能的公文系統(tǒng)、問答系統(tǒng)、知識管理系統(tǒng),那么它相對容易落地,容易交付。
第四點,人工智能應(yīng)當(dāng)作為副駕駛。微軟做的產(chǎn)品叫Copilot,想想還是很有道理。現(xiàn)階段人工智能還是有一些不穩(wěn)定和不確定的情況,不要讓它來做出不可撤銷的決定。
我舉一個例子,比如我們可以專門做一個系統(tǒng),就叫客戶郵件生成,給客戶寫郵件。系統(tǒng)可以生成文本,可以幫助修改用戶的郵件,但是千萬不能接管用戶的郵箱。你想有一天我的機(jī)器分身接管了我的郵箱,自己就給別人發(fā)了一些信件,也太可怕了。
第五點是堅持AI普惠的原則,大模型發(fā)展要以人為本。我們做大模型的創(chuàng)業(yè),不要給企業(yè)宣揚(yáng)有了這個東西就會裁員。
過去很多信息化系統(tǒng)在落地之后,跟普通的企業(yè)的基層員工沒有關(guān)系。
但人工智能的辦公系統(tǒng)的用戶實際上是單位里的很多普通員工、中層干部,當(dāng)然也包括領(lǐng)導(dǎo)。如果中層骨干和基層員工都討厭你的系統(tǒng),你的系統(tǒng)一定不會成功。這件事表面看起來是 to B 的模式,最后實際上你的產(chǎn)品的使用終端是 to C 的,最終的用戶還是企業(yè)里的個人。
第六點,也是和它相關(guān)的一個觀點,因為我們需要讓企業(yè)里的每個人都能使用,我們做to B產(chǎn)品時需要考慮產(chǎn)品體驗。我認(rèn)為現(xiàn)在有些人宣揚(yáng)LUI,也就是用自然語言作為交互界面,現(xiàn)在有點走火入魔了,我也不認(rèn)同我們每個人都要變成prompt專家。
網(wǎng)上有人研究寫 prompt 寫到那個令人發(fā)指的程度,那 prompt 你說它是中文嗎?說它是自然語言,它寫得又很格式化,說它是編程語言嗎?它比編程語言還復(fù)雜。寫prompt對于我們的觀眾來說可能不是很難,但是對一個企業(yè)的普通員工來說,基層員工來說,這個東西比搜索還要門檻要更高一些。
所以我在內(nèi)部講,能用程序解決的問題千萬不要用自然語言去解決。不要迷信LUI,我認(rèn)為未來CUI、GUI將成為主流。
CUI(Conversational User Interface 對話式用戶交互界面),是指可以把一些功能定義成數(shù)字人。數(shù)字人絕不僅僅局限于直播中,我們在政府里面做了一些嘗試,提供數(shù)字顧問。當(dāng)員工面對一個法律顧問時,他只會問跟法律相關(guān)的問題,更適合專業(yè)的垂直大模型。
GUI(Graphical User Interface)是圖形化交互界面。很多場合下,比如點餐,在圖形化界面上快速的點選其實還是最方便的交互方式。如果拿語言說,"我要一個蔥姜肉絲,多加點蔥,不要姜。"雖然機(jī)器能理解,但是它依然很繁瑣。
大模型很好,但大家不要走極端,總說要把GUI都消滅。將來的應(yīng)用,背后可能是大模型的API,但是前端依然會是各種應(yīng)用軟件的界面,這樣也能更好地和企業(yè)的業(yè)務(wù)系統(tǒng)融合。所以我建議三條路并行, LUI滿足高級用戶, CUI 滿足領(lǐng)導(dǎo), GUI 滿足普通員工。
所以最后總結(jié)一下,在我想象里,如果今天你有幸給一個企業(yè)做一個行業(yè)或者垂直的大模型,你不要試圖去解決萬能的問題,你不要試圖去解決所有的問題,你也不要跟它原來的業(yè)務(wù)系統(tǒng)糅合地特別緊密,你就是挑一個領(lǐng)域說,我?guī)湍阕鲆粋€知識管理,或者知識問答的應(yīng)用。
不過知識管理,大家不要狹隘地理解為回答問題。舉個例子,有一次我聽百度的 Robin 在臺上講,說他們進(jìn)入了造車領(lǐng)域。我一開始有些不解,他和我解釋說,一個車廠有上萬種零件,有幾千種工藝。創(chuàng)造一個工具,使大家可以及時地找出來應(yīng)該用什么零件,這本身是知識搜索的范疇可以解決的。你會發(fā)現(xiàn),在很多場景下,本質(zhì)的邏輯都是知識搜索。
我建議大家去選小的切口,小的場景。比如我了解到,山東省想推文旅大模型,讓外地的人知道山東不僅有淄博的燒烤,還有其他的旅游項目。這用知識問答就可以解決,知識問答的方向可能是文旅知識,面向的是全國各地的旅游者。選這種小的接口、小的場景,特別容易成功。
現(xiàn)在很多甲方對于大模型依然還是一個半信半疑的態(tài)度,他們不是我們這行業(yè)里的人,他們也被無數(shù)新技術(shù)騙過。每次出來一個新技術(shù)都有公司找到他們,勸說他們花錢做個新技術(shù),所以客戶希望的是我能不能花點小錢,快速地一兩個月、兩三個月能出一個成果。
如果這個成果出來之后,他的客戶,他的員工都能用一下,像我們第一次用 ChatGPT 一樣,有一個"哇"的感受,我認(rèn)為你就獲得了第一步的成功。所以這個模式的驗證可能比你第一次要掙客戶q一個億可能更為重要。
守住安全底線 邁出大模型創(chuàng)業(yè)堅實一步
最后,構(gòu)建企業(yè)級大模型,我認(rèn)為應(yīng)該遵循安全、向善、可信、可控。
安全指的是網(wǎng)絡(luò)安全、數(shù)據(jù)安全、算法安全,這也是360核心要解決的方向。向善的原則,主要是內(nèi)容安全,要注意不要讓AIGC成為詐騙者的工具。
可控,是如何把大模型關(guān)在籠子里邊,保證它變得非常 powerful(強(qiáng)大) 的時候不會危害人類。這邊有兩個原則,一個是說永遠(yuǎn)讓人在決策的回路上,而不能讓大模型決策。第二個我覺得做垂直大模型也是一個很好的解決思路。垂直大模型出錯的概率比一個天才大模型出錯的概率要低很多。
大模型的進(jìn)化剛剛開始,百模大戰(zhàn)才是第一波浪潮,有了開源之后,萬"模"亂舞都是有可能的。我覺得企業(yè)級市場具有無限的創(chuàng)業(yè)可能性,而且這個市場不會被壟斷,不會被統(tǒng)一。
360也做了自研通用大模型"360智腦",我們希望能夠與許多創(chuàng)業(yè)者合作。如果你愿意做行業(yè)市場,那 360 可以提供 to B方向很多的經(jīng)驗和算力。我們也愿意把很多原來是我們安全的客戶分享給大家,因為每一個行業(yè)都需要有大模型的深度結(jié)合。光有 foundation model (基礎(chǔ)模型)是不夠的,與B端結(jié)合的技術(shù)和經(jīng)驗非常重要。
我們目前的服務(wù)已經(jīng)落地了。我們和中稅集團(tuán)合作做了一個稅務(wù)大模型,在注冊稅務(wù)師考試?yán)锩妫覀儽?ChatGPT 還高 5 分。那么我們也跟黑馬創(chuàng)業(yè)聯(lián)合做了一個企業(yè)服務(wù)大模型,幫企業(yè)寫各種評高新企業(yè)的報告,人寫報告大概花幾個月,大模型寫報告效率比人能夠提升 20 倍。我們也發(fā)起了 GPT 產(chǎn)業(yè)聯(lián)盟。
許多創(chuàng)業(yè)者希望說我像 OpenAI 一樣做一個大模型,我就等著賣 API 賺錢了。這個想法我覺得對創(chuàng)業(yè)者是很難的。還有人希望說我做一個大模型,我就賣給企業(yè),企業(yè)直接采購了去自己用。真正做過 to B的人都知道這個想法很不切實際。即使是Oracle(甲骨文),在中國還有很多增值服務(wù)商,幫助它能夠和企業(yè)的行業(yè)理解,企業(yè)的具體的業(yè)務(wù)領(lǐng)域相結(jié)合。
所以,現(xiàn)在要說在大模型的to B方向能夠形成一個產(chǎn)品方法論,我的建議就是:深度垂直,重度垂直。不能太貪心,上來之后就選擇多個行業(yè)鋪開。你可以在某一個行業(yè),比如說教育,比如說醫(yī)療,選擇行業(yè)中的一個頂尖的,有數(shù)據(jù)有知識的企業(yè)進(jìn)行深度合作,我覺得這可能是大模型創(chuàng)業(yè)最堅實的第一步。
謝謝大家。