2023世界人工智能大會雖然已經(jīng)閉幕,但由ChatGPT掀起的大模型熱潮還將繼續(xù)涌動,人工智能的布局和探索也將是近些年的一大主題。“先上牌桌”“搶下先手棋”是掀起這一輪“百模大戰(zhàn)”熱潮的行業(yè)共識,并引導行業(yè)跨入“千模大戰(zhàn)”。圖片來源:由無界 AI 生成
7月初申城人工智能熱潮涌動,2023世界人工智能大會無論參展企業(yè)數(shù)量還是展覽面積均創(chuàng)歷屆之最,多家企業(yè)在會上宣布將發(fā)布AI大模型。高溫、強對流天氣都沒能沖散大家的熱情,展會門口一度引來黃牛售票,不少人扶老攜幼一探人工智能發(fā)展前沿趨勢。
熱潮下,也應該冷靜看到大模型仍面臨魯棒性、合規(guī)可信等核心問題。與發(fā)達國家相比,我國在芯片、算力、數(shù)據(jù)等方面仍有差距,數(shù)據(jù)稀缺是影響大模型應用落地的一大難題,其中高質量的中文語料數(shù)據(jù)獲取難度大是制約國內大模型發(fā)展的一大因素。
在核心問題尚待突破、差距正在彌合的現(xiàn)階段,中國的AI發(fā)展要探索一條怎樣的發(fā)展路徑?在三天論壇和對現(xiàn)場多位參會行業(yè)專家的采訪中,記者得到的最多答案是“垂直整合”“落地應用”,在垂直領域率先嘗試應用起來,構建組合式AI系統(tǒng)是近些年國內AI發(fā)展趨勢。
“先上牌桌”
當前,發(fā)展數(shù)字經(jīng)濟已成為全球共識。人工智能作為一種戰(zhàn)略性新興技術,正日益成為產業(yè)升級和生產力提升的核心驅動力 。2022年11月,OpenAI推出對話式通用人工智能大模型ChatGPT,全球新一輪AI創(chuàng)新熱潮隨之掀起,國內多個人工智能大模型相繼推出并快速迭代。
在2023世界人工智能大會上,大模型是當仁不讓的主角。百度文心一言、阿里云通義千問、華為云盤古、訊飛星火、商湯日日新、瀾舟孟子MChat、星環(huán)無涯Transwarp Infinity、蜜度蜜巢系列、拓爾思 拓天、達觀“曹植”等通用和垂直大模型讓人目不暇接。
薩摩耶云科技集團創(chuàng)始人、董事長林建明在會場接受《國際金融報》記者采訪時指出,AI正處于新一輪產業(yè)趨勢的起點。從大模型的布局來看,百度、阿里、華為等“高端玩家”從算力層、平臺層、模型層、應用層進行“四位一體”布局;科研院校及初創(chuàng)科技公司另辟蹊徑,以研發(fā)大模型算法及細分領域應用為切入口。
林建明表示,目前國內大模型參數(shù)基本都處于千億及以上規(guī)模,應用方向看,大部分企業(yè)前期以內部應用為主,逐漸向B端企業(yè)進行延伸。人工智能技術不斷取得突破,大廠和中小科技公司競相逐鹿大模型,自然誰都不愿錯過這個時代大浪潮。只有“先上牌桌”,才能抓住規(guī)則這張“王牌”。而在移動互聯(lián)網(wǎng)紅利消退的背景下,選擇擁抱大模型,有望帶來新的增長點。
IEEE/CAAI Fellow、清華大學惠妍講席教授、電子系長聘教授、銜遠科技創(chuàng)始人周伯文告訴《國際金融報》記者,中國應走通基于“自主創(chuàng)新、安全可控”的大語言模型與生成式人工智能技術發(fā)展路線,著力推動具備通用能力的大模型在垂直行業(yè)的廣泛應用落地。此外,商業(yè)應用、學術創(chuàng)新和技術生態(tài)都需要多元化,不能完全集中在一個大模型之上,也不應都用一種思路去做事情。
多重挑戰(zhàn)
AI熱潮下,大模型仍面臨魯棒性、合規(guī)可信等多重挑戰(zhàn)。林建明直言,和國際上比尤其是對標美國,我們在AI芯片、專利、算法研究、成熟的創(chuàng)新生態(tài)系統(tǒng)等方面仍存在一定差距。現(xiàn)在制約國內大模型發(fā)展的主要在于:一是大模型需要大算力,我們在芯片及算力方面存在短板;二是缺乏高質量的中文語料數(shù)據(jù)和行業(yè)數(shù)據(jù);三是專業(yè)人員數(shù)量稀少,基礎研究創(chuàng)新力不夠。
“金融業(yè)是個特殊的存在,對風險管理和安全性要求非常高。研發(fā)金融大模型面臨的信任風險、模型風險、倫理、穩(wěn)定性、準確性、數(shù)據(jù)安全、合規(guī)性等風險的挑戰(zhàn)更加嚴峻。”林建明指出。
馬上消費副總經(jīng)理、首席信息官蔣寧在接受《國際金融報》記者采訪時表示,AI大模型仍面臨在關鍵決策上的動態(tài)適應性、魯棒性、合規(guī)可信等核心問題,如何排除噪音以及干擾性問題,在突發(fā)和不可預期情況下,實現(xiàn)關鍵決策的持續(xù)穩(wěn)定和合規(guī)可信尤其關鍵。
蔣寧指出,國內大模型缺乏原創(chuàng)性突破,模型推理能力、大模型生成能力仍有差距。大規(guī)模、高質量的中文語料數(shù)據(jù)獲取難度大是制約國內大模型發(fā)展的一大因素。具體到金融領域,其還面臨隱私保護、持續(xù)穩(wěn)定、合規(guī)可信等多方面的挑戰(zhàn)。
周伯文認為,當前AI大模型的訓練,算法端向神經(jīng)網(wǎng)絡Transformer模型收斂,算力端依賴具備大規(guī)模并行計算能力的AI服務器集群,數(shù)據(jù)端則需要巨大數(shù)據(jù)量的大規(guī)模數(shù)據(jù)集投喂,如果從AI三要素來看,數(shù)據(jù)稀缺性明顯是導致大模型應用落地的一大難題。諸如金融行業(yè)這類對數(shù)據(jù)安全和用戶隱私保護要求極其嚴格的特定領域,也向大模型提出了可信賴、自主可控與強安全等一系列挑戰(zhàn)。
周伯文表示,大模型產業(yè)化也面臨挑戰(zhàn):一是數(shù)據(jù)規(guī)模大,且數(shù)據(jù)質量參差不齊;二是模型的體積大,訓練難度很高;三是算力規(guī)模大,性能要求高。因此,大模型研發(fā)依賴算法算力和數(shù)據(jù)的綜合支撐。大模型是未來產業(yè)發(fā)展的重點,但大模型的商業(yè)模式值得探討。因為大模型的成本壁壘非常高,大公司和小企業(yè)都有各自的負擔。
垂直整合
在核心問題尚待突破、差距正在彌合的現(xiàn)階段,中國的AI發(fā)展要探索一條怎樣的發(fā)展路徑?還有哪些發(fā)展機遇?蔣寧指出,構建組合式AI系統(tǒng)是發(fā)展趨勢,有效結合各種垂直領域的辨別式模型的可用性和專業(yè)性,以及生成式大模型的遷移學習和泛化能力強的特點,從而在工業(yè)界真正發(fā)揮大模型的泛化能力優(yōu)勢。
林建明指出,大模型未來在城市、行業(yè)、企業(yè)等千行百業(yè)數(shù)智化過程中大有可為。國內布局大模型要加強自主創(chuàng)新能力,從算力、算法、人才等各個層面提升大模型的核心競爭力,還要緊密結合國家戰(zhàn)略需求和行業(yè)發(fā)展方向,深入探索行業(yè)痛點和場景。
此外,“要發(fā)揮自身技術、場景、用戶和行業(yè)數(shù)據(jù)及行業(yè)Know-How(行業(yè)秘訣)打造垂直領域大模型;以‘通用模型+行業(yè)Know-How專用模型’為實體經(jīng)濟賦能,建立自身壁壘優(yōu)勢。”林建明表示。
周伯文認為,大模型產業(yè)應從端到端做起,慢慢迭代出更大的商業(yè)模型,或許是更適合的做法。在具備通用能力的基礎之上,于垂直領域不斷訓練、提升大模型的專業(yè)能力,是未來幫助大模型這項技術發(fā)展進步的一種重要手段。
周伯文指出,從理論、技術層面來看,差異一定是存在的。在AI的發(fā)展上,一方面我們是技術層面的追趕者,另一方面我們也很可能成為應用層面的創(chuàng)新者甚至引領者。中國的AI需要探索一條新的道路,即垂直整合從自研通用大模型到應用、用戶全場景閉環(huán),實現(xiàn)生成式人工智能技術與商業(yè)價值“雙落地”。
對于創(chuàng)業(yè)競爭,周伯文認為,可以分成三條路線看待:第一條路線是自己做具備通用能力的底層大模型,從技術算法到模型迭代、場景閉環(huán)都具備;第二條路線是基于別人的模型(如GPT),然后結合自己的行業(yè)Know-how去做訓練;第三條路線是純粹做應用,是將模型拿來直接使用,這種壁壘會較低。