白皮書揭示了英偉達Hopper大芯片的關鍵規格

為英偉達下一代 H100 加速卡提供支撐的 GH100 芯片,紙面規格已經讓人感到十分驚訝。不過周末曝光的白皮書,又讓我們對其有了更深入的了解。據悉,綠廠正在積極利用台積電的 N4(4nm 級 EUV)先進工藝來構建 Hopper GPU,而 H100 大芯片更是被六個 HBM3 高帶寬顯存堆棧給環繞着。

1.jpg

(圖 via ComputerBase.de)

TechPowerUp 指出:GH100 計算芯片擁有 800 億個龐大的晶體管數量,較 GA100 增加近 50% 。

2.png

Hopper GPU 的流處理器設計

有趣的是,在 4nm EUV 工藝的加持下,GH100 的芯片面積卻只有 814 m㎡,小於基於 7nm DUV(台積電 N7 工藝)節點製造的 GA100(826 m㎡)。

3.png

Ampere GPU 的流處理器設計

由圖可知,英偉達 GH100 的組件層次結構與上一代類似,主要數學運算部分被布置到了 144 組流處理器(SM)上。

GH100 擁有 18432 個 FP32(單精度)/ 9216 個 FP64 (雙精度)CUDA 核心,輔以 576 個第四代 Tensor 核心,此外硅片上其中一組 GPC 具有光柵圖形單元。

4.png

鑒於 GH100 具有 6144-bit 的 HBM3 顯存位寬,英偉達或為其標配 80GB VRAM,預計帶寬可超 3 TB/s(且有 ECC 加持)。

主機接口也迎來了重大升級,且 SXM 外形的 PCB 板上配備了最新一代 NVLink 界面(具有 900 GB/s 的帶寬)。

5.png

AIC 插卡版本則是採用了 PCIe 5.0 x16(128 GB/s)接口,且兩者都引入了資源池(resource-pooling)功能。

最後,英偉達正在用更高的功耗來壓榨更多的性能 —— 可知 H100 的典型功率值為 700W,而 A100 僅為 400W 。

6.jpg

不過 H100 並非滿血 SKU,即使高密度的 SXM 外形版本,也只啟用了 144 組 SM 單元中的 132 個 。

PCIe 插卡版本更是僅啟用了 114 個 SM 單元,且兩者的最高時鐘速率都是 1.80 GHz 。

(0)
上一篇 2022-05-04 16:57
下一篇 2022-05-04 17:57

相关推荐