最近有關下一代英偉達 GeForce RTX 4090 的傳聞表明,基於 AD102 GPU 的旗艦遊戲顯卡,或率先突破 100 TFLOPs 的算力大關。作為參考,Ampere 卡皇 GeForce RTX 3090 Ti 的 FP32(單精度)算力在 40-45 TFLOPs 之間。
上月底,@Kopite7kimi 在推測上分享了他的最新猜測 —— 預計來自 AMD 和 NVIDIA 的新一代旗艦遊戲顯卡,都有望突破 100 TFLOPs 的算力大關。
作為消費級遊戲顯卡市場的一個重大里程碑,這一代旗艦遊戲顯卡的性能與功耗也有望迎來飆升 —— 從 275W 大漲到 350-400W 甚至更高(RTX 3090 Ti 已超 500W)。
功耗大漲的主要原因,據說是 AD102 芯片可受益於台積電 4N 工藝的一些重大突破。此前傳聞的 GPU 頻率在 2.2 ~ 2.4 GHz,但最新預估已在 2.8 ~ 3.0 GHz 左右。
再考慮到 Ada Lovelace 可提供 18432 個 CUDA 核心、96MB L2 緩存 @ 384-bit 總線位寬,堆疊的 12 組 GPC 里包含了×6 的 TPC、每 TPC 有 2 組 SM(總計 144 SM)。
(截圖 via WCCFTech)
若理論時鐘速率可達 2.8 GHz,Ada Lovelace 旗艦遊戲顯卡可輕鬆達到 103 TFLOPs 的計算性能,且傳聞暗示了更高的加速頻率。
不過目前看來,它更像是高於平均“遊戲”時鐘的峰值頻率(類似 AMD 的標稱)。
與 Ampere 卡皇 RTX 3090 Ti 相比,100+ TFLOPs 意味着計算性能暴漲一倍以上,但它並不一定等同於整體遊戲性能。
即便如此,這還是遊戲 PC 領域的一次巨大升級(較微軟 Xbox Series X 遊戲主機領先 8.5 倍)。
此外 @Greymon55 推測紅藍兩家的新一代旗艦遊戲顯卡,算力或達 90+ vs 100+ TFLOPs 。
若真如此,廣大 PC 遊戲玩家有望更輕鬆地帶動下一代 8K(甚至光追)遊戲。