來(lái)源:快科技
5 月 24 日上午 11 點(diǎn),NVIDIA 將亮相臺(tái)北電腦展舉辦專(zhuān)題演講,雖然老黃缺席,但 GeForce 業(yè)務(wù)高級(jí)副總裁在列,還是有希望公布 RTX 40 系顯卡的消息甚至是提前發(fā)布。在此之前,爆料達(dá)人 Kopte7kimi 分享了號(hào)稱(chēng)是 AD102 GPU 的內(nèi)核設(shè)計(jì)圖。
AD102 也就是 Ada Lovelace 家族的次頂配核心,也是 RTX 40 系游戲旗艦卡的配置,大概率對(duì)應(yīng) RTX 4090 Ti、RTX 4090 顯卡。
分析來(lái)看,AD102 內(nèi)建多大 12 組 GPC(顯示計(jì)算簇),比上代 GA102 多出 70%。每組 GPC 包括 6 個(gè) TPC(2 個(gè) SM),每個(gè) SM 單元包括 4 個(gè)子核心,這都與安培相同,但不同的是,每個(gè) SM 子核心包含 128 組 FP32 單元,加上 IN32 整數(shù)單元合計(jì)達(dá)到 192。
完整 AD102 包括 24 組 SM,所有就是 12288 個(gè) FP32 單元加上 6144 INT32,說(shuō)通俗易懂點(diǎn)就是 18432 個(gè) CUDA。
緩存方面,AD102 核心中,每組 SM 享有 192KB L1,比安培增加 50%,共計(jì) 4.5MB。L2 增加到 96MB,是安培的 16 倍。
相應(yīng)的,ROP 和 RT 光追單元規(guī)模自然也是水漲船高,AD102 最多 384 個(gè) ROP,RTX 3090 Ti 不過(guò) 112 個(gè)。另外,光追單元升級(jí)到第三代,Tensor 單元升級(jí)到第四代。
基于此,RTX 4090 最終實(shí)現(xiàn)性能翻番似乎并不是可望不可及的虛妄,就 FP32 單精度浮點(diǎn)來(lái)說(shuō),外界預(yù)期能到 90T,而 RTX 3090 Ti 不過(guò) 40T,代價(jià)就是超 600W 的功耗 ……