AI芯片H100的熱度還沒(méi)過(guò),芯片巨頭英偉達(dá)(Nasdaq:NVDA)又打出一張新王牌——H100的升級(jí)版。
當(dāng)?shù)貢r(shí)間11月13日,英偉達(dá)正式宣布,在目前最強(qiáng)AI(人工智能)芯片H100的基礎(chǔ)上進(jìn)行一次大升級(jí),發(fā)布新一代H200芯片。H200擁有141GB的內(nèi)存、4.8TB/秒的帶寬,并將與H100相互兼容,在推理速度上幾乎達(dá)到了H100的兩倍。H200預(yù)計(jì)將于明年二季度開(kāi)始交付,英偉達(dá)尚未公布其價(jià)格。
英偉達(dá)還透露,下一代Blackwell B100 GPU也將在2024年推出,性能已經(jīng)“望不到頭”。
英偉達(dá)預(yù)計(jì)在2024年推出H200和B100兩款芯片。來(lái)源:英偉達(dá)官網(wǎng)與作為前輩的A100和H100相比,H200最大的變化就是內(nèi)存。搭載“世界上最快的內(nèi)存”HBM3e技術(shù)的H200在性能上得到了直接提升,141GB的內(nèi)存幾乎是A100和H100最高80GB內(nèi)存的2倍,4.8TB每秒的帶寬則達(dá)到了A100的2.4倍,也顯著高于H100 3.35TB每秒的帶寬。
英偉達(dá)表示,根據(jù)使用Meta的70B大模型Llama 2進(jìn)行的測(cè)試,H200的輸出速度幾乎是H100的兩倍。基于與H100相同的Hopper架構(gòu),H200將具有H100的一切功能,例如可以用來(lái)加速基于Transformer架構(gòu)搭建的深度學(xué)習(xí)模型的Transformer Engine功能。
根據(jù)官方發(fā)布的圖片,H200在大模型Llama 2、GPT-3.5的輸出速度上分別是H100的1.9倍和1.6倍,在高性能計(jì)算HPC方面的速度更是達(dá)到了雙核x86 CPU的110倍。
來(lái)源:英偉達(dá)官網(wǎng)英偉達(dá)加速計(jì)算總經(jīng)理兼副總裁伊恩·巴克 (Ian Buck)表示:“要利用生成式AI和高性能計(jì)算HPC來(lái)構(gòu)建智能,需要利用大容量、超高速的GPU內(nèi)存來(lái)高速快速地處理大量數(shù)據(jù)。英偉達(dá)H200將為業(yè)界領(lǐng)先的端到端AI超級(jí)計(jì)算平臺(tái)進(jìn)一步加速,以解決一些世界上最重要的挑戰(zhàn)。”
從今年年初起,英偉達(dá)股價(jià)已經(jīng)上漲了超230%,截至11月14日,公司總市值達(dá)到1.2萬(wàn)億美元。當(dāng)天,英偉達(dá)股價(jià)在H200發(fā)布后一度漲超490美元,全日收于486.2美元,漲0.59%,盤后漲0.3%,股價(jià)實(shí)現(xiàn)九連漲。
美國(guó)知名經(jīng)濟(jì)評(píng)論員吉姆·克雷默(Jim Cramer)表示,英偉達(dá)最新的高端芯片可能會(huì)為其股價(jià)提供推動(dòng)力,幫助其在生成式AI熱潮中進(jìn)一步上漲。
此前,根據(jù)瑞杰金融(Raymond James)統(tǒng)計(jì)的數(shù)據(jù),H100芯片的價(jià)格已經(jīng)到達(dá)了25000美元到40000美元之間,而一個(gè)AI訓(xùn)練過(guò)程需要數(shù)千個(gè)這樣的芯片協(xié)同工作。在當(dāng)下的AI熱潮中,這也使得H100成為了硅谷最搶手的“硬通貨”。
科技網(wǎng)站The Verge表示,最關(guān)鍵的問(wèn)題在于英偉達(dá)能否為市場(chǎng)提供足夠的H200,或者它們是否會(huì)像H100一樣在供應(yīng)量上受到限制。而對(duì)于這點(diǎn),英偉達(dá)并沒(méi)有給出明確的答案,只表示公司正在與“全球系統(tǒng)制造商和云服務(wù)提供商”合作來(lái)供應(yīng)這些芯片,亞馬遜、谷歌、微軟和甲骨文等云服務(wù)商將是明年二季度首批使用H200的公司之一。
另外,英偉達(dá)競(jìng)爭(zhēng)對(duì)手AMD已經(jīng)在英偉達(dá)之前搶先推出了最新AI芯片MI300X,高達(dá)192GB的HBM3內(nèi)存,5.2TB/秒帶寬。此前,AMD表示,公司正在今年第三季度向客戶提供樣品,產(chǎn)量將在第四季增加。預(yù)計(jì)AMD將在北京時(shí)間12月7日凌晨舉辦的“Advancing AI”特別活動(dòng)上正式發(fā)布MI300X GPU。
值得一提的是,此前有消息稱,英偉達(dá)已開(kāi)發(fā)出針對(duì)中國(guó)市場(chǎng)的最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle。知情人士稱這三款芯片由H100改良而來(lái),英偉達(dá)最快或?qū)⒂诒驹?6號(hào)之后公布。澎湃新聞?dòng)浾卟稍L了多位產(chǎn)業(yè)鏈人士,均證實(shí)英偉達(dá)改良版芯片屬實(shí)。英偉達(dá)官方尚未對(duì)此作出評(píng)論。
今年10月17日, 美國(guó)商務(wù)部工業(yè)和安全局(BIS)發(fā)布了針對(duì)芯片的出口管制新規(guī),尤其是對(duì)高算力的AI芯片進(jìn)行了更嚴(yán)格的管控。其中一個(gè)很重要的新規(guī)定就是調(diào)整了先進(jìn)計(jì)算芯片受限的標(biāo)準(zhǔn),設(shè)置了新的“性能密度閾值”來(lái)作為參數(shù)。
10月31日,中國(guó)貿(mào)促會(huì)新聞發(fā)言人張?chǎng)伪硎荆婪叫掳l(fā)布的對(duì)華半導(dǎo)體出口管制規(guī)則,進(jìn)一步加嚴(yán)了人工智能相關(guān)芯片、半導(dǎo)體制造設(shè)備對(duì)華出口的限制,并將多家中國(guó)實(shí)體列入出口管制“實(shí)體清單”。美國(guó)這些措施嚴(yán)重違反了市場(chǎng)經(jīng)濟(jì)原則和國(guó)際經(jīng)貿(mào)規(guī)則,加劇了全球半導(dǎo)體供應(yīng)鏈撕裂與碎片化風(fēng)險(xiǎn)。美國(guó)自2022年下半年開(kāi)始實(shí)施的對(duì)華芯片出口禁令正在深刻改變?nèi)蚬┬瑁斐?023年芯片供應(yīng)失衡,影響了世界芯片產(chǎn)業(yè)格局,損害了包括中國(guó)企業(yè)在內(nèi)的各國(guó)企業(yè)的利益。
英偉達(dá)將于美國(guó)時(shí)間11月21日盤后發(fā)布2023財(cái)年第三財(cái)季財(cái)報(bào)。根據(jù)美國(guó)投資研究公司Zacks Investment Research的數(shù)據(jù),預(yù)計(jì)調(diào)整后的每股收益(EPS)將達(dá)到3.01美元,去年同期為0.34美元。