隨着評測解禁,英偉達 GeForce RTX 4090 也被人壓榨出了 100 TFLOPs 的算力,成為了迄今性能最為強悍的遊戲顯卡。作為參考,公版(Founders Edition)顯卡的默認性能為 83 TFLOPs(低了 17 TFLOPs),而上一代 GeForce RTX 3090 Ti 更是只有 40 TFLOPs 。
為了達成 100 TFLOPs,WCCFTech 試着解鎖功率與溫度限制,並將 GPU 核心 / 顯存頻率分別提升了 +275 / +1100 MHz 。
接着通過 Afterburner 給 GPU 核心加壓 +55%,不然可能在 100% 佔用率下導致性能滑坡。
然後這張 RTX 4090 顯卡的 AD102 GPU 核心飆到了 3150 MHz、最大功耗 547W、最高溫度 69℃,而且測試是在風冷條件下實施的、沒有使用水冷或液氮散熱。
最終我們看到了將近 101 TFLOPs 的神奇數據,較默認狀態下提升了 22% 的性能、達到了 RTX 3090 Ti 的 2.5 倍。
此外這枚 AD102 GPU 的 FP32 性能也超過了 50%,將面向數據中心的 Hopper H100 GPU 也拋在了腦後。
相信當 Quadro 專業卡產品線也迎來 Ada Lovelace 架構更新時,我們有望見到 RTX 6000 / L60 成為業內流行的計算 / AI 加速卡。
規格方面,RTX 4090 啟用了 144 組 SM 單元中的 128 組 / 16384 個 CUDA 核心,輔以 72MB L2 緩存 / 176 個 ROP 光柵單元。
顯存為 24GB @ 384-bit 的 21Gbps GDDR6X,帶寬高達 1 TB/s(與 RTX 3090 Ti 一致),TBP 功耗 450W、通過單 16-pin 12VHPWR 接口供電(理論功率上限 600W)。