Kestrel超算採用了AMD霄龍Genoa、英特爾Sapphire Rapids和英偉達H100硬件

由慧與(HPE)為美國能源部旗下的國家可再生能源實驗室(NREL)打造的 Kestrel 超級計算機,其規格已正式公布。在 NREL 於去年宣布了該計劃之後,現在我們終於知曉它將採用 AMD 霄龍 Genoa、英特爾 Sapphire Rapids、以及英偉達 H100 加速器硬件,並且能夠提供高達 44 PFLOPS 的算力。

1.jpg

(via WCCFTech)

在三家科技巨頭最新軟硬件技術的加持下,Kestrel 旨在接替現有的 Eagle 超算。而在最近的一次會議上,HPE 首次揭示了這套超算系統的硬件規格。

可知Kestrel 超算採用了標準節點 + 加速節點的組合方案,具有 44 PetaFlops 的峰值性能 —— 較 Eagle 超算提升了 5.5 倍。

● 其中標準節點採用了英特爾最新的 Sapphire Rapids 至強可擴展 CPU(本例中為 52 核 / 104 線程的 SKU)。

● 在 2304 個標準節點中,都使用了雙路 CPU 方案(總計 4608 顆 Sapphire Rapids-SP 處理器,239616 核 / 479232 線程)。

● 75 PB 數據存儲(Lustre),且 2304 個節點中的每一個都提供了 256GB DDR5 內存(總計 560 PB 系統內存)。

2.png

另有 132 個加速節點:

● Kestrel 選擇了為每個節點配備四路基於 Hopper 圖形架構的英偉達 H100 GPU 加速卡 @ AMD 雙路 EPYC Genoa 服務器處理器組合。

● 總計有 528 塊英偉達 Hopper H100 GPU 加速卡,以及 264 顆 AMD EPYC Genoa 芯片(最高 96C / 192T)。

至於加速節點中的確切 CPU / GPU 配置型號,目前暫不得而知。若採用頂級配置方案,那 Kestrel 有望獲得總計 8921088 個 CUDA 核心(H100 SXM5)+ 25344 個 Zen 4 CPU 核心。

3.jpg

此外 Kestrel 加速節點還具有 42 TB 的 HBM3 高帶寬緩存 + 20 TB 系統內存,輔以 8 個 DAV 節點(其中包括多達 16 路英偉達 A40 GPU 加速卡)。

所有這些都使用了 HPE 的 Slighshot Dragonfly 互連方案,以下是 HPE Slingshot 互連的一些亮點:

● 行業領先的性能與可擴展性

● 採用 100GbE 和 200GbE 高速接口

● 搭配高基數、64 端口、12.8 Tb/s 帶寬的高性能交換機

● 可擴展至 25 萬+主機端口 / 最多 3 個躍點

● 創新的硬件擁塞管理、自適應路由與 QoS 服務質量控制

● 採用標準的以太網協議,輔以優化的高性能計算(HPC)特性

● 鏈路級重試與低延遲前向糾錯

● 開放且標準化的 API 管理接口

4.png

最後,儘管 Kestrel 超算的每瓦特性能為 10.4 gflops(遠不及最近宣布的能效超 50 gflops/watt 的 Frontier 超級計算機),但其造價依然相當昂貴(甚至高於 ExaFlops 系統)。

如若一切順利,NREL 的 Kestrel 超級計算機預計可在 2024 年完成部署。

(0)
上一篇 2022-06-01 10:28
下一篇 2022-06-01 10:29

相关推荐