日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52010
  • 待審:67
  • 小程序:12
  • 文章:1106242
  • 會員:784

來源:IT之家 

微軟公司出席 Hot Chip 2024 大會,分享了 Maia 100 芯片的規(guī)格信息。Maia 100 是臺積電 5nm 節(jié)點(diǎn)上制造的最大處理器之一,專門為部署在 Azure 中的大規(guī)模 AI 工作負(fù)載而設(shè)計。

Maia 100 芯片規(guī)格如下

芯片尺寸:820 平方毫米

封裝:采用 COWOS-S 夾層技術(shù)的 TSMC N5 工藝

HBM BW/Cap;1.8TB/s @ 64GB HBM2E

峰值密集 Tensor POPS: 6bit: 3,9bit: 1.5, BF16: 0.8

L1/L2:500MB

后端網(wǎng)絡(luò) BW:600GB/s(12X400gbe)

主機(jī) BW(PCIe):32GB/s PCIe Gen5X8

設(shè)計 TDP:700W

Provision TDP:500W

Microsoft Maia 100 系統(tǒng)采用垂直集成方式,以優(yōu)化成本和性能。它還采用定制服務(wù)器板,配備專門設(shè)計的機(jī)架和軟件堆棧,以提高性能。

Maia 100 架構(gòu)

高速 Tensor 單元可為訓(xùn)練和推理提供高速處理,同時支持多種數(shù)據(jù)類型,單元采用 16xRx16 結(jié)構(gòu)。

矢量處理器是一個松散耦合的超標(biāo)量引擎,采用定制指令集架構(gòu)(ISA),支持包括 FP32 和 BF16 在內(nèi)的多種數(shù)據(jù)類型。

直接內(nèi)存訪問(DMA)引擎支持不同的張量分片方案。

硬件 semaphores 支持 Maia 系統(tǒng)的異步編程。

為提高數(shù)據(jù)利用率和能效,大型 L1 和 L2 scratch pads 交由軟件管理。

Maia 100 采用基于以太網(wǎng)的互聯(lián)技術(shù)和類似 RoCE 的定制協(xié)議,可實(shí)現(xiàn)超高帶寬計算。它支持高達(dá) 4800 Gbps 的 all-gather 和 scatter-reduced 帶寬,以及 1200 Gbps 的 all-to-all 帶寬。

在軟件方面,Maia 軟件開發(fā)工具包(SDK)允許任何人快速將其 PyTorch 和 Triton 模型移植到 Maia。Maia SDK 為開發(fā)人員提供了多個組件,使他們能夠輕松地將模型部署到 Azure OpenAI 服務(wù)。

分享到:
標(biāo)簽:數(shù)碼
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 52010

    網(wǎng)站

  • 12

    小程序

  • 1106242

    文章

  • 784

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定