國內互聯網巨頭的大模型正接連投入“實戰”,在商業場景落地方面不斷打磨,拉開大模型賦能產業的序幕。
文|劉青青 石丹
ID | BMR2004
轟轟烈烈的全球大模型浪潮已經持續了大半年,從赫赫有名的AI target=_blank class=infotextkey>OpenAI、google、Anthropic、Meta,到國內互聯網科技巨頭百度、阿里、騰訊、京東、華為、360……各種大模型產品層出不窮。
在這場“百模大戰”里,國內大模型活力驚人,在創業、投資、融資、應用等領域如火如荼。但是我們也能清楚地看到,國內大模型與國際技術水平的差距。
在人工智能時代,大模型的出現仿佛人類社會走進第五次工業革命,有一些從未有過的東西蓬勃興起,有一些習以為常的東西驟然消失,還有一些擔憂揮之不去,但是科技和社會的進步依舊向前。
01
“百模大戰”
國內大模型產品遍地開花,已經落地的大模型產品數量遠遠超過了北美、歐洲地區。
大模型浪潮還在加速奔涌。毫無疑問,美國在AI大模型領域表現強悍。2022年底,OpenAI發布的ChatGPT掀起全球大模型浪潮,此后2023年3月,OpenAI發布萬億級大模型GPT-4;Anthropic發布Claude 2;Google發布當前最大的視覺語言模型PalM-E;Meta推出AI語言模型 LLaMA和視覺模型SAM。
除此之外,韓國科技巨頭 Kakao 旗下人工智能部門Kakao Brain宣布推出AI圖像生成器 Karlo 2.0;韓國搜索巨頭NAVER發布語言大模型HyperCLOVA;LG集團人工智能智庫LG AI Research 推出擁有3000億參數的Exaone多模態模型;德國初創公司Aleph Alpha發布了一款擁有700億參數的預訓練模型Luminous;歐洲AI初創公司 Hugging Face創建BLOOM大模型……
在國內,大模型產品更是接連落地,各大互聯網科技巨頭紛紛入局。2023年3月,基于文心大模型,百度發布“文心一言”,成為中國第一個類ChatGPT產品。此后華為發布“盤古”大模型、京東發布“言犀產業”大模型、阿里發布“通義千問”大模型、科大訊飛發布“星火認知”大模型、360公司發布通用大模型“360智腦”。除此之外,騰訊也傳出發布大模型產品“混元助手(HunyuanAide)”的消息。
同時,商湯宣布推出大模型“商湯日日新”、昆侖萬維和奇點智源合作發布“天工3.5”、知乎聯合面壁智能發布中文大模型“知海圖AI”、網易發布“玉言”大模型、達觀數據推出“曹植”系統、瀾舟科技發布孟子對話大模型“MChat”……
“百模大戰”硝煙四起,大模型之爭如火如荼。
值得一提的是,在大廠之外,國內還有另外一股“大模型勢力”。
引力創投合伙人、微博前副總經理、《超越想象的GPT醫療》譯者蘆義指出,在國內大模型浪潮當中,高校的研究走在了互聯網科技巨頭的前面。例如清華大學的ChatGLM-6B、復旦大學的MOSS大模型、香港大學的SGPT大模型等。這些高校的研究更早于互聯網科技巨頭,也積累了更多的經驗和技術。
蘆義直言,國內大模型產品遍地開花,已經落地的大模型產品數量遠遠超過了北美、歐洲地區。但國內的大模型公司多是互聯網科技巨頭,它們在原本的商業基礎上進軍AIGC領域,而國外大模型公司則大多屬于研究機構和AI初創公司,因此形成了不同的風格特點。
“例如,國外大模型多在實驗室中打磨,常常作為技術研究成果來展現。而中國互聯網科技巨頭依托產業發展,大模型產品在商業當中得到了很大的應用。”蘆義表示。
02
產業為王
目前大模型處于“百花爭艷”的狀態,站在這個時間點,企業應該思考的不是技術追趕,而是產業突破。
國產大模型大多已經接入各種類型的商業應用。
對內,各大互聯網科技巨頭開始將大模型投入自身業務。例如阿里的“通義千問”大模型將首先部署于阿里的數碼協同辦公和應用開發平臺“釘釘”,以及物聯網智能家居終端機“天貓精靈”上,后續它還將接入阿里生態的所有商業應用。百度CEO李彥宏更是直言,百度首先要把全部產品用大模型重做一遍,“不是整合,不是接入,而是重做、重構。”
對外,一些大模型產品也被迅速投入到商業場景中進行落地。在國內,已經有15萬家企業申請接入百度“文心一言”,其中有超過300家生態合作伙伴,一起探索了超400個具體的落地場景。
5月中旬,360公司創始人周鴻祎提出:每個城市、每個政府部門都會有自己的專有大模型,大模型和政府的業務系統融合,還會變成政府各個業務板塊的“副駕駛”,甚至成為智慧政府、智慧城市的總調度室,形成城市級GPT。
7月初,華為云發布“盤古大模型3.0”,提出深耕行業。據了解,此前華為云已陸續推出了礦山、藥物分子、電力、氣象、海浪、鐵路等大模型,7月初又發布政務、金融、制造大模型,持續為業界貢獻先進的算法和解決方案。
7月中旬,京東推出“言犀”大模型,提出以完整工具鏈助推產業價值創造。京東的言犀AI開發計算平臺,能夠為客戶的大模型開發和行業應用開發提供定制化解決方案。它既具備行業知識庫,沉淀了京東自身在零售、物流、健康、金融等多個行業的Know-How,又具備了100多種訓練和推理優化工具,能將通用模型迅速轉化為專業模型。
弗若斯特沙利文(Frost & Sullivan)發布的《AI 大模型市場研究報告(2023)——邁向通用人工智能,大模型拉開新時代序幕》指出,大模型“基礎設施—底層技術—基礎通用—垂直應用”發展路線逐漸清晰,國內各廠商加速戰略布局,加大資金和技術投入,迎頭趕上全球大模型產業化浪潮,本土化大模型迎來發展新機遇。
京東集團副總裁、京東科技智能服務與產品部負責人何曉冬博士表示,目前大模型處于“百花爭艷”的狀態,站在這個時間點,企業應該思考的不是技術追趕,而是產業突破。技術上各家都是基于Transformer做大規模預訓練,并不斷地進行調優。
可以看到,國內互聯網巨頭的大模型正接連投入“實戰”,在商業場景落地方面不斷打磨,拉開大模型賦能產業的序幕。
03
融資火熱
中國大模型企業正備受資本青睞,大模型創業風潮涌動。
值得一提的是,“百模大戰”也是一場“燒錢”的競賽,充沛的算力、海量的訓練參數、堅實的硬件,還有頂尖的AI人才,無一不是“經費在燃燒”。
以重量級模型GPT-4為例,其擁有1.8萬億巨量參數,13萬億token(自然語言處理中的“詞單元”)的訓練數據。以H100物理機每小時1美元計算,一次的訓練成本就高達6300萬美元(約人民幣4.51億元)。
蘆義指出,OpenAI發布大模型GPT-4之前已經耗資上百億美元,不過隨著大模型開源和技術的不斷發展,進入此領域的資金門檻會越來越低。目前訓練出一個可以投入運行的大模型,投入資金大約在千萬美元,就是簡單一些的模型也在幾百萬美元左右。
與此相對應的是,關于大模型的投融資愈發火熱,投融界仿佛興起了一股“圍獵”大模型的風潮,AI大模型公司的融資消息不絕于耳。
2023年初,微軟第三次“加倉”OpenAI。此次投資后,微軟累計在OpenAI上投資100多億美元。4月,OpenAI又完成超百億美元融資,估值達到270億~290億美元(約合人民幣1900億~2000億元)。參與本輪融資的風投公司還包括老虎全球管理、紅杉資本、加州Andreessen Horowitz、紐約Thrive和K2Global,Founders Fund等。
而OpenAI的“強敵”Anthropic也在5月宣布獲得4.5億美元C輪融資。此輪融資由Spark Capital領投,谷歌、Salesforce Ventures,Sound Ventures,Zoom Ventures等參投。
有趣的是,同樣加入“大模型之戰”的Google,不僅發布了5620億參數的“史上最大AI多模態模型”PaLM-E,而且還四處“押寶”其他AI大模型初創公司。公開資料顯示,Google累計向Anthropic投資了3億至4億美元,同時還投資了AI視頻生成獨角獸Runway,以及Redpanda Data,Typeface,Infisical,Warp,Speakeasy等涉及AI、數據、安全、IT等領域的企業。
即便是連大模型產品都還沒有落地的加拿大AI初創公司Cohere,也在6月宣布完成2.7億美元的C輪融資,估值達到21億美元。本輪融資由加拿大全棧風險投資機構Inovia Capital領投,互聯網軟件巨頭Salesforce、人工智能計算公司英偉達、硅谷公司Index Ventures等多家全球機構和戰略投資者參投。
值得一提的是,Cohere此前已經吸引了多家知名機構的投資,投資者涵蓋老虎環球基金、英偉達、“AI教父”Geoffrey Hinton、斯坦福大學教授李飛飛、加州大學伯克利分校教授Pieter Abbeel等。
在國內,AI大模型也正在成為中國硬科技投資的一個新風向,尤其是在AI初創企業當中,更是資本涌動。
據了解,美團聯合創始人王慧文收購了AI創業公司光年;創新工廠董事長李開復創辦零一萬物,建立Project AI 2.0大語言模型;前搜狗CEO王小川創立AI公司百川智能;京東AI前掌門人周伯文建立AI公司銜遠科技……大量互聯網大佬下場“大模型”試水。
在剛過去的6月里,AI初創大模型公司月之暗面完成首輪市場融資,獲紅杉、真格等一線 VC 的押注,市場估值被曝約3億美元;AI初創企業生數科技宣布完成近億元人民幣的天使輪融資,該筆融資由螞蟻集團領投,百度發起的 BV 百度風投、卓源資本跟投,目前估值達1億美元;AI 蛋白設計公司“域新說生物”已完成近千萬元天使輪融資,投資方為九合創投。
除此之外,語言大模型企業瀾舟科技在年初完成數億元融資;通用大模型初創企業MiniMax完成新一輪融資,總規模超2.5億美元,項目估值超過10億美元,躋身AIGC獨角獸行列;深言科技(DeepLang AI)近期獲得騰訊的10億元級別融資,其此前投資方還包括紅杉資本、巨人聯創、達晨創投、金山軟件等知名機構。
總而言之,中國大模型企業正備受資本青睞,大模型創業風潮涌動。
04
仰望AI
中國大模型的發展整體依舊處于圖文訓練階段,而將大模型產品融進千行百業,還將需要各大互聯網科技公司進一步地實戰打磨。
AI確實能夠做到很多人類力有不逮的事情,比如背誦或者快速計算,但當前存在的問題也很突出,尤其是在聽、說、讀、寫各個方面,即使最基礎的文本回答,也常常有大模型給出胡編亂造的答案來。因此,大模型的發展依舊任重而道遠。
在蘆義看來,訓練參數在70億左右的大模型屬于中等規模,可以在很多設備上“跑起來”。并且通過一些算法調整,在簡單的使用場景下,這些大模型都可以做到快速問答。但是要真正投入市場,落地商業場景的大模型,其訓練參數應達到650億以上,而且大模型得到的數據訓練越多,給出的答案越精準。
“在OpenAI的ChatGTP-3.5的版本上,已經能夠看到希望。”蘆義表示,一方面,在此之前,ChatGTP版本都是自動生成文本答案,與人類交流對話大相徑庭,而現在ChatGTP-3.5已經能表現出很大的智能;另一方面,如果無法給出答案,大模型會通過互聯網“外掛”搜尋和學習知識盲點,倘若依舊無法解決,大模型也會承認不知道而非“生成式胡編”。
有人將ChatGTP-3.5的更新看做是“奇點來臨之前的一個小突破”,期待著在這個奇點上能“大力出奇跡”,促成新的技術、新的變革。而在商業落地方面,當語言模型剛剛誕生的時候,大模型的商業模式就已經悄然延伸。
蘆義指出,首先,大模型在通過數據“喂養”和訓練之后,需要有語言模型的配合才能夠進行生成和表達。因此語言模型是大模型產品的基礎,此前掀起風潮的ChatGPT就是語言大模型。國內互聯網科技巨頭能夠通過大模型在內容創作、內容檢索方面迅速革新。
其次,在能夠表達文字的語言模型面世之后,圖片也隨之被訓練。實際上,有了語言模型的基礎,圖片模型更加容易搭建,既可以用語言模型結合圖片模型進行創作,也可以將不算尖端的語言模型直接拿來訓練圖片,變成圖片模型,畢竟圖片模型甚至不需要像語言模型一樣具有完備的語言邏輯表述。
再次,在圖文模型之后,多模態大模型成為下一步的方向。在視覺上,要讓大模型“不光能看懂文字,也能看懂圖片”;在聽覺上,要讓大模型“不光能看還能聽”,接下來混入聽、說、看、讀、寫各種感知都會陸續延展開來,這時候的大模型將會帶來AI與現實世界的結合。
不過,目前來說,大模型的發展整體依舊處于圖文訓練階段,而將大模型融進千行百業,還將需要各大互聯網科技公司進一步地實戰打磨。
05
“機械之心”
如今,人工智能正在構建人工智能。或許真的有一天,人類可以認同大模型也有一顆“機械之心”,能像人類一樣進行正常的溝通交流甚至是生活。
很多人都知道,ChatGTP并不完美,但是它能明明白白地展示:人工智能發展方向正在從辨別式走向生成式。周鴻祎認為,GPT的出現代表著超級人工智能時代的到來。原來的人工智能只是“弱人工智能”,帶來的影響也有限,而如今的大模型屬于通用人工智能,在很多維度上已經超越了人類。GPT最大的意義是,人類第一次把所有的知識進行了重新編碼和存儲,現在GPT-4已經是世界上最聰明的“人”,這是一個巨大的拐點。
無論是生活還是商業,大模型仿佛都勾勒出一個美好的朦朧未來。作為湛廬文化/浙江科學技術出版社出版的《超越想象的GPT醫療》一書的譯者,蘆義已經在使用大模型進行工作了。在他看來,翻譯不可能完全交給機器,要靠人來“咀嚼”文字,把關情緒。不過,大模型確實對于翻譯工作的效率有了十倍甚至是幾十倍的提升。作為助手,大模型可以準確地幫助譯者歸納、匯總、摘要,也可以執行簡單的推理翻譯任務。
可以想象,未來大模型可以幫助人類做翻譯、駕駛、清潔等工作,也可以如《超越想象的GPT醫療》一書中所述:成為醫生忠誠的助手。
大算力、大模型、大數據讓“智能涌現”(神經網絡訓練完成后,出現出乎意料的新行為功能,而這些行為可能與初始訓練目標無關)。李彥宏指出,過去的人工智能是,如果想讓機器學會什么技能,就教它什么技能。教過的有可能會,沒教過的就肯定不會。在大模型出現“智能涌現”之后,以前沒教過的技能,它也會了。
在大模型訓練初期,還需要科研人員幫忙“喂飯”,但是如果大模型產品成熟之后,它就能夠做到自我學習。
蘆義也指出,語言模型重要的特點是它有通用推理能力,就像人有思考能力一樣。大模型當然不會主動去做推理和思考,還需要人類來引導。隨著語言模型的迭代提升,或許大模型的下一個版本就不再需要人類引導,而是學會了“自我思考”。
就像是人類學會了使用工具一樣,大模型也會使用“外掛”。蘆義認為,當它的算法不足以推斷準確的信息時,它會去學習更新的數據,用數學內容解決數學問題,用電氣知識解決電氣問題,用歷史信息回答歷史問題。
“例如,人工智能系統AlphaDev,它使用強化學習來發現增強的計算機算法,把人類無法再提高的算法效率又提高了70%。這意味著人工智能生成的算法已經超越了人類,人工智能正在構建人工智能。未來將是AI自己改良AI,在某些方面人類不用參與也無法再參與。”蘆義表示。
這其實是一個令人驚喜又恐懼的發現,但是或許真的有一天,人類可以認同大模型也有一顆“機械之心”,像人一樣溝通交流甚至是生活。
來源 | 《商學院》雜志2023年8月刊