北京時(shí)間周二晚間,英偉達(dá)聯(lián)合創(chuàng)始人兼CEO黃仁勛時(shí)隔5年再度登上SIGGRAPH的舞臺(tái)發(fā)表主旨演講,期間提及一系列與生成式AI浪潮息息相關(guān)的硬件和軟件服務(wù)。
SIGGRAPH由ACM SIGGRAPH(計(jì)算機(jī)協(xié)會(huì)計(jì)算機(jī)圖形圖像特別興趣小組)舉辦,是計(jì)算機(jī)圖形學(xué)的年度頂級(jí)會(huì)議。
對(duì)于再度登上SIGGRAPH的舞臺(tái),黃仁勛也是頗為感慨。他回憶稱,2018年正是在SIGGRAPH的舞臺(tái)上,他發(fā)布了能夠在實(shí)時(shí)渲染中完成光線追蹤的RTX平臺(tái),那也是英偉達(dá)的“賭命時(shí)刻”。時(shí)過境遷,當(dāng)年發(fā)布顯卡時(shí)他可以把顯卡拿在手上展示,現(xiàn)在由Grace Hopper芯片組成的產(chǎn)品只能放在臺(tái)子上展示了。
(來源:直播視頻)
“買得越多、賺得越多”的GH200
黃仁勛也再度提到今年5月臺(tái)北電腦展上發(fā)布的GH200系統(tǒng),同時(shí)通過動(dòng)畫展示了如何使用NVLink等技術(shù),將Grace Hopper超級(jí)芯片與HBM3e高速連接,并構(gòu)建出一整套為生成式人工智能打造的超級(jí)計(jì)算機(jī)。
順便一提,最后的圖片是按照實(shí)物大小展示,中間那個(gè)影子就是黃仁勛。這套系統(tǒng)能夠無縫連接256個(gè)Grace Hopper超級(jí)芯片——對(duì)應(yīng)的是1 EFLOPS的AI算力和144TB的高速存儲(chǔ)。
黃仁勛還順便解釋了一下GH200“買得越多、賺得越多”這件事情。作為比較,同樣使用1億美元打造數(shù)據(jù)中心,可以買下8800個(gè)x86的CPU或2500套GH200,但后者的AI算力是前者的12倍,同時(shí)能耗也更低。
反過來算,只需要花800萬美元采購(gòu)210套GH200,就能達(dá)到與1億美元CPU數(shù)據(jù)中心同等的AI算力。
Omniverse
Omniverse是Nvidia創(chuàng)建的實(shí)時(shí)3D圖形協(xié)作平臺(tái),主要的功能就是創(chuàng)建“數(shù)字孿生”,在虛擬世界中模擬現(xiàn)實(shí)。
在周二的演講中,黃仁勛也拿世界最大廣告公司W(wǎng)PP和比亞迪(騰勢(shì)汽車),作為Omniverse云和生成式AI的使用案例。WPP通過Omniverse為騰勢(shì)N7打造了一個(gè)實(shí)時(shí)、囊括各種外觀配置的汽車“數(shù)字孿生”,并能夠通過Adobe等提供的AIGC功能修改宣傳材料的圖像背景。
Hugging Face
在這一輪AI浪潮中脫穎而出的共享機(jī)器學(xué)習(xí)模型和數(shù)據(jù)集平臺(tái)Hugging Face(俗稱“抱抱臉”)也出現(xiàn)在周二的舞臺(tái)上。黃仁勛宣布,英偉達(dá)已經(jīng)與Hugging Face達(dá)成合作協(xié)議,幫助該社區(qū)推出一項(xiàng)AI模型訓(xùn)練服務(wù),背后自然有英偉達(dá)DGX云的支持。
AI 工作臺(tái)
隨著各種模型的開發(fā)變得日常工作,開發(fā)者也有在不同設(shè)備間同時(shí)開發(fā)大模型的需求。一個(gè)統(tǒng)一,且能調(diào)用不同算力、同步微調(diào)結(jié)果的“AI工作臺(tái)”應(yīng)運(yùn)而生。通過AI工作臺(tái),開發(fā)人員能夠在PC或工作站上快速創(chuàng)建、測(cè)試和自定義預(yù)訓(xùn)練的生成式AI模型,然后將其擴(kuò)展到幾乎任何數(shù)據(jù)中心或者公共云上。
另外,英偉達(dá)也發(fā)布了最新版本的企業(yè)軟件平臺(tái)NVIDIA AI Enterprise 4.0,為企業(yè)用戶提供生成式人工智能所需的工具。
L40S顯卡、新工作站和服務(wù)器
對(duì)于那些想要配置本地算力資源的個(gè)人和創(chuàng)業(yè)公司而言,英偉達(dá)也在周二發(fā)布了新的工作站產(chǎn)品,每個(gè)工作站最多可以塞進(jìn)去四張NVIDIA RTX 6000顯卡,對(duì)應(yīng)的參數(shù)為5,828 TFLOPS AI算力和192GB顯存。黃仁勛介紹稱,用這臺(tái)機(jī)器,微調(diào)400億參數(shù)的GPT-3大概只需要15個(gè)小時(shí)。
在這里,黃仁勛再一次強(qiáng)調(diào)“買得越多、賺得越多”,直言像這樣的工作站,用來開發(fā)大模型,幾個(gè)月就能把本金賺回來了。
英偉達(dá)也在周二發(fā)布了基于Ada Lovelace架構(gòu)的新顯卡L40S。官方數(shù)據(jù)介紹稱,與A100相比,L40S的生成式AI推理性能提高最多1.2倍,訓(xùn)練性能提高最多1.7倍。L40S 包含 18,176 個(gè)CUDA內(nèi)核,單精度浮點(diǎn) (FP32) 性能是A100的近5倍。
隨后,黃仁勛也把遮在臺(tái)上的黑布揭開,展示了一系列新的OVX服務(wù)器產(chǎn)品。新的OVX系統(tǒng)最多可以裝8張L40S顯卡,每張顯卡擁有48GB的顯存。黃仁勛也強(qiáng)調(diào),這些服務(wù)器設(shè)計(jì)時(shí)的用途,并不是用來訓(xùn)練最尖端的大模型(例如GPT-4),而是用來運(yùn)行從“抱抱臉”上下載的主流大模型。
與前面提到的工作站相比,這些服務(wù)器微調(diào)400億參數(shù)的GPT-3大概只需要7個(gè)小時(shí)。
通用場(chǎng)景描述
通用場(chǎng)景描述(OpenUSD)是一種高性能3D場(chǎng)景描述技術(shù),對(duì)于3D交互而言,類似于超文本標(biāo)記語(yǔ)言(html)與2D網(wǎng)頁(yè)之間的關(guān)系。這項(xiàng)技術(shù)最早在2015年由皮克斯動(dòng)畫工作室創(chuàng)造,并在2016年開源。英偉達(dá)的Omniverse也正是以O(shè)penUSD作為基礎(chǔ),以成為連接各類3D制作工具的平臺(tái)為愿景來開發(fā)。
黃仁勛在周二宣布,英偉達(dá)將為開發(fā)者和公司提供廣泛的框架、資源和API服務(wù),以加速OpenUSD的采用,并推出ChatUSD來幫助開發(fā)者利用自然語(yǔ)言實(shí)現(xiàn)一系列場(chǎng)景的調(diào)整。