聲明:本文來自于微信公眾號 量子位(ID:QbitAI),作者:魚羊 蕭簫 發自 凹非寺,授權轉載發布。
這就是站在技術浪潮的最前沿,李彥宏的最新感悟。
在今天的2023中關村論壇上,李彥宏作為開場嘉賓,發表了題為《大模型改變世界》的演講。
這一國際科技大會由科技部、國家發展改革委、工業和信息化部、國務院國資委、中國科學院、中國工程院、中國科協、北京市政府共同主辦。演講嘉賓包括微軟創始人比爾·蓋茨,以及菲爾茲獎得主、圖靈獎得主等頂級科學家代表。
規格之高,不消多說。而微軟和百度,又是如今大洋兩岸最受關注的引領大模型變革的科技公司,雙方創始人同臺演講,早已引發不少關注。
不過,相比于技術本身的“卷”,科技領袖們的著眼點,更加本質。
比如,大模型成為焦點的實質是什么——
大模型成功地壓縮了人類對于整個世界的認知,讓我們看到了實現通用人工智能的路徑。
李彥宏如是分析。
并且,在更為深刻地影響世界之前,AI本身已經因大模型的出現而改變。
處在以大模型為核心的人工智能新起點,現實應用的構建邏輯也已經到了轉變的時刻:
用大模型重做產品,“不是整合,不是接入,而是重做,重構”。
大模型改變人工智能,即將改變世界
為什么說大模型改變了人工智能,又即將改變世界?李彥宏給出了三方面的思考。
首先,是技術本身的突破。
第一個關鍵詞,就是大算力+大模型+大數據,導致的智能涌現。
目前,業界的普遍認識是,500億-600億參數,是大模型是否具備涌現能力的一個門檻。
所謂智能涌現,簡單說就是大模型讓AI學會了“無師自通”,即便是此前沒有接觸過的任務,大模型也能hold得住。
舉個例子,有用戶發現,在要求ChatGPT扮演Linux終端來運行代碼時,ChatGPT真的可以搞定這件事。而這種query在語言模型的訓練階段幾乎不可能出現。
這徹底顛覆了過去AI應用的生產模式,使得AI流水線工廠取代“一事一模型”的AI手工作坊成為可能,使得AI應用的規模化落地成為可能。
與此同時,人工智能發展方向從辨別式走向生成式。
從數學模型上來說,辨別式模型關注的是不同類別的決策邊界,而生成式模型則學習了數據的潛在特征,能通過理解每個類別的底層分布,來學習數據是如何生成的。
△圖源LearnOpenCV
從實際案例來說,搜索引擎就是經典的辨別式AI。而文心一言這種會進行文學創作、寫報告、畫海報的,就是生成式AI。
生成式AI不僅使得人工智能更具“創造力”,更關鍵的是,它重新定義了人機交互:
對于人類而言,最自然的交流方式就是語言溝通。如果一句話就能讓電腦幫你整理數據繪制圖表,當然會比手動點開一大堆數據頁面再逐個整理分析高效得多。
值得關注的是,大模型改變人工智能背后,底層的IT技術棧也發生了根本變化,即從芯片層(CPU為主)、操作系統層、應用層的三層架構,發展成為了四層架構:芯片層(GPU為主)+框架層+模型層+應用層。
這種IT架構的適配,正是“大力出奇跡”的基礎,使得大算力、大模型、大數據能夠三位一體,集中到一起打配合。
目前,無論是國外的微軟、谷歌、亞馬遜,還是國內的百度,都有從底層硬件到上層應用軟硬一體的布局。
其中,只有百度是全球唯一全棧布局四層架構的公司。
其次,是產業需求的變化。
此前,李彥宏曾預測,大模型時代將產生三大產業機會,分別是:
新型云計算:其主流商業模式從IaaS變為MaaS。企業選擇云廠商的關鍵因素,會從算力、存儲等基礎云服務,向框架、模型,以及模型、框架、芯片、應用四層之間的協同轉變。
行業模型精調:通用大模型和企業之間的中間層,可以基于對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。
基于大模型底座的應用開發
在這背后,需求側的邏輯是,產業的需求在大模型的沖擊下會發生改變,充分發揮大模型降本增效能力的AI原生思維將會影響所有產品、服務和工作流程。
那么,什么樣的應用是AI原生應用?盡管還在探索的初期階段,但大模型興起以來,完全基于AI孵化出的創新產品已經嶄露頭角。
比如Jasper,一個通過AI幫助企業和個人寫營銷推廣文案的應用。截至去年10月,Jasper估值已達15億美元。
而AI繪畫應用Midjourney,則已憑借訂閱付費模式,在一年內實現了約1億美元的營收。
李彥宏提到,百度內部的辦公軟件如流,現在也已基于文心一言,給每一位員工配備了一個具有豐富專業知識,能實時響應的工作助理。這個AI助理通過對話理解能力,可以實現對聊天記錄的智能總結,在百度內部獲得了一眾好評。
李彥宏還強調:
百度要做第一個把全部產品重做一遍的公司,不是整合,不是接入,是重做,重構!
實際上,不止于百度,李彥宏認為,未來的趨勢是所有應用都將基于大模型來開發。大模型最終深度融合到實體經濟當中的具體體現,會是每個行業都有屬于自己的大模型。
最后,是人們日常生活的改變。
大模型能快速破圈,成為街頭巷尾人人討論的話題,與其給個人帶來的直觀效率提升不無關系。
李彥宏引用研究機構的數據指出:未來10年,知識工作者的效率可以提升4倍。
這種效率提升,甚至會徹底改變人們的工作方式:
AI原生應用涌現之后,大量的工作交互最后都會編程提示詞工程。
未來你的薪酬水平,將取決于你的提示詞寫得好不好,而不是取決于你的代碼寫得好不好。
李彥宏甚至大膽預測:10年后,全世界有50%的工作會是提示詞工程,提出問題比解決問題更重要。
作為全球大模型競逐中,國內最接近華山之巔的一號位,李彥宏的思考,亦是一份大模型落地征途中最具價值的參考答案。
事實上,以上三重思考,不僅停留在理論,百度本身已在躬身實踐。
而另一方面,李彥宏放言“百度要做第一個把全部產品重做一遍的公司”,亦是行業大勢之下,競逐牌桌上話語權的決心體現。
百度為什么能做到?
百度發力大模型的更深層次原因,或許可以從行業現狀和技術積累兩個方面來解讀。
首先是行業趨勢。當下以大模型技術為代表的AIGC領域,已經開始從技術和應用兩方面變革各行各業的生產方式,甚至帶來突破性的效率提升。
根據量子位智庫預測,AIGC市場規模會在2030年達到1.15萬億元,期間將經歷培育摸索期、應用蓬勃期和整體加速期三個階段。
△來源于量子位智庫
即使目前還在培育摸索期階段,新玩家還在不斷涌現,大模型頭部領域的競爭卻已經到了白熱化階段。
尤其行業中進展最快的技術玩家,已經開始有上層應用落地的趨勢。
在國外,以OpenAI為例,根據SimilarWeb數據,ChatGPT僅2023年4月份,全球訪問量就已經達到17.6億次;至于與ChatGPT和GPT-3相關的應用,據gpt3demo統計已經超過800個,光是這兩個月就增加了200多個。
在國內,百度也已經透露了大模型相關應用數據。文心一言開始企業內測之后,在與百度智能云接洽大模型業務的客戶中,新客戶比例已經超過老客戶比例,有超過300+企業參與內測。
顯然,當底層大模型技術達到穩定進入實際生產環節的水平,上層就會不斷開發出真正有突破性質量的應用。
伴隨著應用數量不斷增加形成生態,最終將徹底在電商、內容、辦公、交通等領域產生巨大的行業變革。
△來源于量子位智庫
營銷客服行業,百度文心一言目前已經將智能客服的知識生產效率提升了9倍,多輪對話構建的成本下降65%,終端用戶認為客服接近真人的比率也在上升。
城市交通行業,目前北京亦莊的300多個路口,全都部署了百度AI信控系統,通過智能調整紅綠燈的時間,提升最高30%的交通效率,有效解決了北京堵車這一“歷史性難題”。
但若僅僅從行業變革的速率和市場規模角度出發,還無法完全解釋百度發力大模型的原因。
畢竟從打造大模型的算力、數據和算法等層面的難度來看,僅憑短期的技術自研,顯然難以支撐“快速重構所有產品”這一做法。
因此,從自身實力來看,百度這些年在自研芯片、架構到AI算法等各方面的“技術基底”,恰恰又成為了發力這波大模型浪潮必備的關鍵因素。
具體來說,主要可以分為三個方面。
其一,是在AI技術、尤其是大模型技術上的長期投入和積累。
最早從2013年開始,百度就在布局AI相關的技術,累計十年下來已經投入超過1000億元,其中核心研發投入多個季度占比超過20%;
巨量研發投入背后,是技術護城河的建立,截至2022年4月,百度全球AI專利申請已經超過2.2萬件。
這樣的技術積累,讓百度如今在大模型研發必不可少的芯片、框架、模型和應用四層架構中,均實現了對應的自研技術積累。
芯片層上,百度自研芯片昆侖二代,已經量產并部署了幾萬片,而昆侖芯最新的第三代,則預計2024年初投入量產;
框架層上,百度從2016年就開源了飛槳深度學習框架,目前這一框架已經集成了深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件等工具組件,在中國市場份額中排行第一;
模型層上,文心一言背后的核心技術文心大模型,從2019年開始就已經發布1.0版本,并在后續研發中不斷進行優化,目前已經迭代到3.5版本;
應用層上,百度除了研發了單獨的十個行業大模型以外,在搜索、智能云、自動駕駛、小度等上面也已經積累了不少研發經驗。
不過,在各層技術棧上“單獨發力”,還只是百度大模型的核心競爭力的一部分。
其二,針對這四層核心架構打出“組合拳”,又進一步形成了百度獨特的技術優勢。
雖然國外如亞馬遜、國內阿里都已經在芯片層、模型層上發展了自研技術,微軟則也已經在框架層和應用技術上有所準備。
但百度之所以同時發力自研芯片、框架、模型和應用領域,正是側重于優化這些架構之間的高效協同,從而讓自研大模型的基礎設施能力進一步提升。
打個比方,對于大模型而言,想要極致優化推理速度和使用成本,算力、框架、模型、應用就像是四個齒輪,各自轉速之外,很大程度上還要看它們之間的“配合能力”。
如今,這種“配合能力”,也已經成為百度發力大模型的獨特優勢。
打通四層技術架構后,百度已經能在基礎設施層面上,打出千卡加速比90%、資源利用率70%,開發效率提升100%這樣的“組合拳”。
如今,這一套組合拳更是在文心一言大模型應用的成本上,有直觀的體現:
此前3月份啟動內測時,如今不到2個月,百度大模型文心一言已完成4次技術版本升級,其推理成本更是已經降為原來的十分之一。
最后,在自主可控上,百度的這些技術不僅能用在自身大模型上,還能反過來進一步加速行業大模型的生產落地。
換而言之,文心一言不僅做到了數據可控、框架可控、模型可控,在全球科技領域中擁有話語權,更能將這一套技術對外輸出,助力行業加速打造更多大模型。
以百度已經在內測的文心千帆大模型平臺為例,僅需少量數據、最快幾分鐘,大模型就能完成一次“定制化”,極大地加速了大模型從研發到生產的全套過程。
而文心千帆的這一套流水線,并非僅為文心一言所打造,其訓練調優經驗和技術,已經可以向第三方輸出。
換而言之,百度不僅是這波大模型變革浪潮的“參與者”,更是其中的“發力者”,其技術不僅可以用于構建大模型底座,更能對外輸出,讓國內更多玩家在這一領域具備國際競爭力。
“先上全球AI競賽的牌桌,才能擁有話語權”
不過,在大模型應用范圍日漸擴增、關注度愈發火熱的當下,AI行業下一步究竟該如何走,國內外學界和產業巨頭中也出現了不一樣的聲音。
國外玩家中,要屬在大模型這一領域進展最快的OpenAI觀點最受關注。
作為OpenAI創始人,Sam Altman認為AI技術必將改變世界,因此必須對技術進行監管。
目前,OpenAI已經主動提出對行業接下來要發展的AI技術進行控制,甚至建立對應的國際AI監管機構:
未來十年內,人工智能系統將在很多領域超越專家水平,并且產出能夠與當今的最大企業相匹敵。
同樣,微軟創始人比爾·蓋茨也在采訪中提到,AI正在給就業醫療等領域帶來變革性的影響力,但隨著技術發展,監管是必不可少的因素。
不過,馬斯克則是直接反對行業繼續探索AGI相關的技術,不僅參與簽署了“暫停巨型AI實驗”的千人聯名信,還呼吁暫停更先進的AI系統訓練。
顯然,在AGI研究日漸火熱的當下,要不要繼續發展大模型技術,是否會出現“失控”危害人類的超級智能AI,已經成為一個頗具爭議性的觀點。
作為國內大模型頭號玩家的掌舵者,李彥宏如何看待這一話題?
從國際競爭的角度來看,李彥宏認為,在國內外大模型技術發展存在一定差距的當下,發展技術仍舊是優先級最高的選擇。
以中國科學家企業家的身份,李彥宏依舊堅信“技術改變世界”的觀念:
至少要先上牌桌,贏得全球競賽的入場券,才能獲得話語權,參與規則的制定。
—完—