來源:快科技
5 月 24 日上午 11 點,NVIDIA 將亮相臺北電腦展舉辦專題演講,雖然老黃缺席,但 GeForce 業(yè)務高級副總裁在列,還是有希望公布 RTX 40 系顯卡的消息甚至是提前發(fā)布。在此之前,爆料達人 Kopte7kimi 分享了號稱是 AD102 GPU 的內核設計圖。
AD102 也就是 Ada Lovelace 家族的次頂配核心,也是 RTX 40 系游戲旗艦卡的配置,大概率對應 RTX 4090 Ti、RTX 4090 顯卡。
分析來看,AD102 內建多大 12 組 GPC(顯示計算簇),比上代 GA102 多出 70%。每組 GPC 包括 6 個 TPC(2 個 SM),每個 SM 單元包括 4 個子核心,這都與安培相同,但不同的是,每個 SM 子核心包含 128 組 FP32 單元,加上 IN32 整數(shù)單元合計達到 192。
完整 AD102 包括 24 組 SM,所有就是 12288 個 FP32 單元加上 6144 INT32,說通俗易懂點就是 18432 個 CUDA。
緩存方面,AD102 核心中,每組 SM 享有 192KB L1,比安培增加 50%,共計 4.5MB。L2 增加到 96MB,是安培的 16 倍。
相應的,ROP 和 RT 光追單元規(guī)模自然也是水漲船高,AD102 最多 384 個 ROP,RTX 3090 Ti 不過 112 個。另外,光追單元升級到第三代,Tensor 單元升級到第四代。
基于此,RTX 4090 最終實現(xiàn)性能翻番似乎并不是可望不可及的虛妄,就 FP32 單精度浮點來說,外界預期能到 90T,而 RTX 3090 Ti 不過 40T,代價就是超 600W 的功耗 ……