日前,第四范式聯合創始人、首席架構師胡時偉受邀錄制了播客節目「夜航西飛」,分享了他與第四范式對大模型的研究與思考。下文轉載自公眾號“MacTalk”,作者池建強。
上周和第四范式的聯合創始人胡時偉做了一次對談。收獲不小。為啥有這次對談,我們的想法其實很直接,絕大部分人都是站在用戶視角從市場側看AI領域的發展,噪音太多。
這次希望能從技術側聽一聽在浪潮之巔領跑的那撥人到底是怎么看ChatGPT,怎么看未來趨勢的。
老胡是第四范式的首席架構師。畢業后去了百度,在創始人戴文淵博士帶的團隊里,用機器學習的技術去做廣告系統,算是中國非常早期的 AI商業化應用實踐了。后來業界流行去 IOE的時候加入了鏈家做戰略轉型,利用技術把人的結構轉變成基于互聯網的結構。2015年作為聯合創始人和戴文淵、陳雨強一起創辦了第四范式。
下面是我的總結,這期內容會以播客的形式,發布到夜航西飛。
1、要顛覆什么
企業日常經營就是在不斷地做決策并執行。這些年,輔助決策是 AI或者大數據技術的一個重要應用場景。決策就是說企業處理一個事情的時候,比如營銷、分發,有很多種不同的做法,要選擇什么樣的做法。
但決策類AI不容易做。因為決策,上游需要高質量的數據作為輸入,下游的具體服務得靠人提供。
先說下游執行服務的人。人的不確定性太多了,你出策略,即使 AI做得再好,只是輔助,執行如果不到位,數字化也不會有進展。執行,過去我們是人主要驅動的,即使有 CRM、ERP、HR,都是靠人,用非數字化的方式執行了之后,把結果一項一項填到系統里面去。
比如 CRM系統,每次寫記錄都費老大勁,好不容易攢幾句話交差,之后卻從來沒用上,因為真正需要沉淀、復用、流通的業務經驗其實存在于執行過程中,所以很多難用的系統,用著用著就邊緣了,沒有提供業務價值,反倒成了負擔。
上游輸入的數據也是個大問題。
前幾年講,好的企業好的團隊要講究閉環,迅速迭代、螺旋前進,但迭代的依據怎么來呢?得靠數據。數據怎么來呢?完蛋了,執行的過程絕大多數企業壓根沒收集到數據。
這里的“數據”,不是說你沒有歷史數據,而是你今天正在開展的業務里邊沒有足夠的反饋數據。什么是反饋數據?
員工跟企業之間的數據交換其實有三條通道。
第一條是接受信息、接受培訓,比如視頻、文字、PPT;第二條通道是人與人之間的交流,跟同事跟主管跟客戶的交流;第三個通道是什么呢?是用系統。
做決策,我們只能用系統里邊的這些數據去產生策略,但在這三條路徑當中,系統能占多少?
其實你仔細看,在一個員工的所有數據里,系統可能 5%都占不到, 95%的時間你是在閱讀,在跟人聊天,在寫 PPT、填表格、開會,所以95%的數據都不在系統里。這部分,反而是我們最想萃取的專家知識。
舉個例子,我之前做 ToB業務,銷售團隊經常需要和客戶溝通。當時有一個非常優秀的銷售,業績一直遙遙領先。有一段時間我們就想怎么讓經驗流通起來,找了一個萃取專家。
他有點類似咨詢公司做的事,采訪這個銷售問到底是怎么做的,比如一個線索進來你怎么聊天?如果客戶對我們產品感興趣,怎么辦?不感興趣又怎么辦?如果客戶不理你了第二天怎么辦?總之是一步一步怎么跟的。當時這個萃取專家做了幾個小時的訪談,整理了一個比較簡單的銷售流程 SOP,我們就根據這個 SOP給團隊其他的銷售看,照這個流程做。
但萃取這件事情大概率是不能通用的,無效的原因就是因為很難有一個非常優秀的萃取專家。因為專家首先得懂業務,其次還得懂怎么拆解落成 SOP。如果這個銷售懂怎么把自己的經驗一步一步梳理出來,沉淀成 SOP,也就不需要萃取專家了。
所以對企業來說,關鍵是什么?關鍵是能不能把流程梳理出來構建成軟件。
但在現實業務流程里,環境太復雜,那95%都是非結構化的、多模態的,我們沒法抽象化、標準化,有的甚至都沒法數據化。
這是數據的困境。
過去的信息化其實是把所有的業務步驟抽象為表單和流程。表單比如 Excel,有的企業自嘲說自己的數字化特別落后,都在 Excel里邊做,其實這也是一種數字化,還是一個比較經濟的數字化方式。問題只是這些數據難以得到利用。
我司做直播那會也是用 Excel做,后來切到了多維表格上。但多維表格也得懂怎么調各種視圖,還是有門檻。現在已經把數據集成到對話機器人里了,輸個指令,直接收到回答。
ChatGPT的創意就是讓聊天或者說一對一的溝通,成為了知識庫的一部分,成為了軟件。企業可以大大擴展數據的邊界,突破5%。
以前的系統和表單解決不了的、溝通不了的,由于有了 GPT,機器擁有了跟人很好交互的能力,甚至是多輪的、復雜的、帶思維鏈交互的能力。問題,一部分轉嫁給算力,一部分轉嫁給企業自身對業務的理解,做中間部分的 SaaS企業可以比之前做薄太多,大大降低成本,實現所有 ToB企業的夢想——用標準化的成本,完成定制化的需求。
未來企業,AI會成為一個生產要素。除了員工之外,還會有一批“AI員工”。
2、該做點什么
AIGC在應用上確實是超出所有人預料,包括 OpenAI的 CEO Sam Altman。但 ChatGPT,從技術視角來看,其實沒有太強沖擊性。技術的發展是線性的,但公眾的感知是階段性的。技術和市場之間有巨大的鴻溝。
我們對變革的感知,往往是出于一些標志性的社會事件,比如1997年深藍打敗國際象棋冠軍,世界都震驚了,一批有志青年開始投身編程,后來一家美國 SaaS公司用數據技術抓住了本拉登,2016年 AlphaGO在圍棋上又打敗了人類最強棋手,再到今天的 ChatGPT。
當生產力變革來臨,絕大多數人都躺在同一起跑線上,后知后覺。
AI領域發展起起落落,從 1956年到現在,每隔 10年、20年就會重大變革一次,人們就會瘋狂一輪,市場迅速激活資本爭相押注,推動下一次變革,相同的問題被翻出來討論:AI會替代掉哪些崗位?會不會改變人類社會?
都爭這么多年了,我們也不用焦慮。就像之前有人問我該給自己家娃報什么專業合適,是不是要報個火熱的將來發展前景好。問題是現在是火熱,等孩子真讀幾年出來,這個領域要么已經人才貶值卷成花卷,要么已經涼了。
但技術與技術之間確實是有區別的。有的能帶來巨大變革,像蒸汽機、電力、計算機對人類歷史的改變,有的像移動互聯網對人類社會的沖擊,有的比如操作系統、iPhone重新定義體驗。老胡總結技術圈看 AI發展,到現在真正有突破性成功的有 4個階段。
第一個階段是人來寫規則,用人的經驗來寫程序。比如 1970年左右研究的專家系統,靠人先把知識總結出來,再輸入給計算機。明顯沒走通。但把專家的經驗變成程序這個事現在業界還在實踐。
第二個階段是機器利用數據,寫少量的規則。這時候開始有一些模型,比如決策樹、簡單的神經網絡。
第三個階段是機器用海量的數據,寫大量的規則。這其實就是深度學習,或者叫專用大模型。廣告、人臉識別就是用的這個。每個模型,只能解決一個問題。
第四次浪潮就是這一次,遷移學習的大模型,也就是我們講的通用大模型。海量的數據,同一個模型,解決不同的問題。形式都是 Transformer的續寫形式,但能力是多樣的,比如問答、總結、擴寫。
前兩次突破,應用的場景非常有限,甚至大部分時候無效。后兩次突破在生產生活會有非常大的作用。
ChatGPT剛出來的時候,所有人喊是一個 iPhone時刻,發酵了半年,現在開始大家覺得它的沖擊介于移動互聯網的誕生和計算機的發明之間。但到底長期怎樣,會不會落在計算機的發明和電作為一種傳輸方式的區間,得讓 AI大模型再飛一會。
3、趨勢是什么
未來會變成什么樣。
ChatGPT讓業界重拾了對 IM機器人的重視,都認為對話框是數字化的最佳解法。我們之前也這么想。
但仔細想想,這應該是輕物理資產、重人力要素的互聯網企業的限定答案,在其他場景比如物流、駕駛、醫療中,人和機器的交互可能需要其他形式。醫生做手術的時候能點對話框嗎,不能,但他可以說話,這是一種交互狀態;司機開車的時候能點對話框嗎,也不能,但是可以用動作,這也是一種交互狀態。
所以 AIGC這個事發展到未來,人和機器一定會是多模態的交互,而且是更接近于人的自然能力。IM只是中間的一個過渡狀態。
輸入法早年在算力不足的時候,大家要學五筆,后來變成了拼音,再后來變成了整句智能,到現在變成了語音轉寫,再之后干脆語音得了,都不用文字轉寫。
做軟件始終要降低自己產品的使用門檻,門檻每降低一點,就意味著潛在用戶有指數級的增加。這也是為什么張小龍說做產品要深刻理解人是懶惰的,是沒有耐心的,是不愛學習的。因為無論用戶多么愿意去主動或被迫適應機器,但是最適合大眾的,一定更符合人的自然交互。
技術發展的方向永遠都是在短期內,人要糾正自己去適應機器,但長期,機器要適用于人。
這是自然規律。