近日,金融大模型發(fā)展論壇舉辦,馬上消費發(fā)布了國內(nèi)首個零售金融大模型“天鏡”。在金融業(yè)數(shù)字化轉(zhuǎn)型的大背景下,人工智能大模型的發(fā)展是大勢所趨,目前我國金融業(yè)中人工智能大模型的發(fā)展尚處于起步階段。
那么,相對于通用大模型而言,金融大模型有何獨特性?又面臨著怎樣的挑戰(zhàn)?在大模型建設(shè)的過程中最重要的是什么?論壇上,譚建榮、倪光南、孫茂松和楊新民四位院士就何為人工智能、何為大數(shù)據(jù)及算力、存力建設(shè)等問題發(fā)表講話,中國信息研究院副總工程師王愛華就如何解決金融大模型安全可信的問題詳細闡述目前采取的具體措施。
算力建設(shè)為金融大模型未來發(fā)展核心
在關(guān)于人工智能的討論中,幾位院士都不約而同地提到了大數(shù)據(jù)算力的建設(shè)問題。譚建榮院士解釋道,常規(guī)的手段、常規(guī)的技術(shù)、常規(guī)的規(guī)矩難以處理的數(shù)據(jù)就是大數(shù)據(jù),在模糊、隨機、混沌的情況下往往需要使用大數(shù)據(jù)。
“數(shù)據(jù)是人工智能發(fā)展的關(guān)鍵因素,數(shù)據(jù)存儲產(chǎn)業(yè)也將成為未來國家的戰(zhàn)略性產(chǎn)業(yè),成為新的國際競爭高點”。倪光南院士進一步指出數(shù)據(jù)存儲市場的局勢,他指出,數(shù)據(jù)存儲目前是被高度壟斷的,“2022年三星、美光、海力士三家公司占據(jù)了DRAM(動態(tài)隨機存取內(nèi)存)97%的市場份額”。
對此,倪光南院士就我國數(shù)據(jù)產(chǎn)業(yè)未來的發(fā)展方向給出三點建議:第一,均衡配置算力與存力,換言之,處理數(shù)據(jù)、存儲數(shù)據(jù)、傳輸數(shù)據(jù)三種能力缺一不可。第二,提高存力中先進存力的比重,適時啟動以固態(tài)硬盤SSD取代機械硬盤HDD的機械革命。第三,在我國數(shù)據(jù)產(chǎn)業(yè)基本具備國際競爭力的基礎(chǔ)上,借助雙循環(huán)迅速擴展規(guī)模,提升性價比和服務(wù)能力。
“大模型、大數(shù)據(jù)、大算力,三者缺一不可。”楊茂松院士指出,從2017年到2021年,算力的成本從1000美金降到5美金,成本降低的同時,算力在不斷增加,兩個因素相互交織著不斷演進。楊茂松預(yù)言,在未來,大語言模型還會向擬人化機器人、三維空間等領(lǐng)域發(fā)展,“這件事肯定會使得行業(yè)生態(tài)重新洗牌”。
安全可信成金融大模型的最大挑戰(zhàn)
馬上消費首席信息官蔣寧表示,在工業(yè)領(lǐng)域、金融領(lǐng)域,大模型應(yīng)用還存在四個難題。首先,大模型和通用大模型的本質(zhì)區(qū)別在于前者要做交易決策,而在決策中1%的誤差都有可能帶來金融風險,因此大模型就要做到“100%決策安全”,安全可信也就成為了金融大模型要解決的首要問題。
對于安全問題的考量不止于此,蔣寧指出,在金融行業(yè)中存在“數(shù)據(jù)孤島”,這會導(dǎo)致大模型無法形成生態(tài),從而很難形成群體智能。群體智能的建立能權(quán)衡各方數(shù)據(jù)權(quán)益,使數(shù)據(jù)得到有效利用,并打造出行業(yè)模型。只有做到共享權(quán)益安全可靠,才能實現(xiàn)真正的競合。此外,在人工智能為客戶服務(wù)的過程中,也存在如何平衡個性化服務(wù)和個人隱私數(shù)據(jù)合規(guī)的問題。同時,金融大模型需要不斷優(yōu)化底層基礎(chǔ)設(shè)施適應(yīng)垂直領(lǐng)域、金融領(lǐng)域的發(fā)展。
具體到解決措施,楊新民院士介紹了大模型的三種技術(shù)方向:第一,基于運籌學思維解決復(fù)雜決策的高效果性、經(jīng)濟性問題。通過參數(shù)調(diào)優(yōu)的訓練速度、多輪對話任務(wù)的計算成本科學問題,推動大模型的產(chǎn)業(yè)應(yīng)用;第二,發(fā)展雙系統(tǒng),促進大模型的可控、可干預(yù)、可解釋;第三,推進多模態(tài)的防偽技術(shù),保證大模型的安全性。
在人工智能可信治理方面,中國信息研究院副總工程師王愛華介紹了研究院推出的人工智能能力測評體系。目前該系列展開的工作涵蓋了各類人工智能測評的環(huán)境和數(shù)據(jù)集,并且已經(jīng)在金融、互聯(lián)網(wǎng)、電信、能源等領(lǐng)域投入測評。