570億晶體管:英偉達推出新一代InfiniBand平台Quantum-2

GTC 2021 大會期間,偉達發布了全新的 InfiniBand 網絡平台,它就是基於 Bluefield-3 DPU 和 Quantum-2 Infiniband 交換機的 Quantum-2 。官方新聞稿稱,其旨在為雲計算提供商和超算中心帶來極致性能、廣泛的可訪問性、以及強大的安全性。

1.jpg

作為有史以來最先進的端到端網絡平台,NVIDIA Quantum-2 底層是 400Gbps 的 InfiniBand 網絡。

在結合該公司的 Quantum-2 交換機、ConnectX-7 網絡適配器、BlueField-3 數據處理單元(DPU),以及所有支持新架構的軟件。

2.jpg

Quantum-2 的帶來,正值超算中心越來越多地向組織之外的公眾開放。與此同時,全球雲服務提供商也在為數以百萬計的客戶提供更多超級計算服務。

功能方面,Quantum-2 能夠為各個領域要求苛刻的工作負載提供其所需的關鍵性能。在暈原生技術的支撐下,它可達成 400 Gb/s 的高性能與先進的多租戶功能。

3.png

英偉達網絡高級副總裁 Gilad Shainer 表示:當今超算中心與公共雲的需求正在融合,所以必須為下一代高性能計算、人工智能、數據分析等挑戰提供儘可能到的性能,同時必須安全地隔離工作負載並響應用戶流量的不同需求。

好消息是,在 NVIDIA Quantum-2 InfiniBand 的加持下,現代數據中心的這一願景現在成為現實。

4.jpg

得益於 400Gbps 的速率,Quantum-2 InfiniBand 不僅讓速度加倍、端口數量增加三倍,還可將性能提升 3 倍、讓數據中心結構交換機的需求減少至 1/6,同時降低數據中心功耗、以及讓空間佔用減少 7% 。

此外 Quantum-2 的多租戶性能隔離,可防止一個租戶的活動干擾到其他租戶。利用具有雲原生功能、先進的基於遙測的擁塞控制系統,還可確保用戶 / 工作負載需求激增情況下的可靠吞吐量。

5-1.png

與上一代相比,Quantum-2 SHARPv3 網絡計算技術為 AI 應用程序帶來了 32 倍的加速引擎,而 UFM Cyber-AI 平台支持數據中心的高級 InfiniBand 結構管理(包括預測性維護)。

此外集成的 ns 精度計時系統,可為分佈式應用程序(比如數據庫處理)帶來更好的同步支持,有助於減少等待和空間時間開銷。而且新功能允許雲數據中心成為電信網絡的一部分,並託管軟件定義的 5G 無線服務。

5-2.png

規格方面,Quantum-2 平台的核心是全新的 Quantum-2 InfiniBand 交換機。其採用了 7nm 製程工藝,在硅片上容納了 570 億個晶體管,規模較 540 億個晶體管的 NVIDIA A100 GPU 還要龐大。

輔以 64 個 400Gbps 端口、或 128 個 200Gbps 端口的靈活搭配,能夠在各種交換機系統中提供多達 2048 個 400 Gbps / 4096 個 200 Gbps 端口的擴展能力,是上一代 Quantum-1 平台的 5 倍以上。

6.jpg

結合網絡速度、交換能力和可擴展性,Quantum-2 非常適合構建下一代巨型高性能計算(HPC)系統。

感興趣的客戶,能夠通過全球廣泛的領先基礎設施 / 系統供應商訂購 Quantum-2,包括 Atos、DataDirect Networks(DDN)、戴爾、Excelero、GIGABYTE、惠與、IBM、浪潮、聯想、NEC、Penguin Computing、QCT、超微(Supermicro)、VAST Data、以及 WekaIO 。

7.png

最後,NVIDIA Quantum-2 平台提供兩個網絡端點選項,分別是 ConnectX-7 NIC 和 BlueField-3 DPU InfiniBand 。

前者採用 7nm 設計,擁有 80 億個晶體管,速率是目前業內領先的 HPC 網絡芯片 NVIDIA ConnectX-6 的一倍,RDMA、GPUDirect Storage / RDMA 和網絡內計算(In-Networking Computing)的性能也翻倍,預計出樣時間為 2022 年 1 月。

後者同樣基於 7nm 設計,具有 220 億個晶體管,輔以 16 個 @ 64-bit 的 ARM CPU 核心來幫助卸載和隔離數據,預計出樣時間為 2022 年 5 月。

(0)
上一篇 2021-11-09 19:07
下一篇 2021-11-09 19:08

相关推荐