Marvell宣布OCTEON 10 DPU平台:採用ARM N2 CPU內核與5nm製程

一年多前,我們就已經聽說過美滿電子(Marvell)的 OCTEON TX2 基礎架構處理器。自那時起,相關生態就一直在公司內外以極快的方式在發展。今天我們要介紹的,就是 Marvell 最新推出的 OCTEON 10 系列 DPU 。作為一個全新的 SoC 系列,其採用了台積電 5nm 製程工藝,且首次用上了 ARM 的 Neoverse N2 CPU 內核。

0.png

上一代的 OCTEON TX 和 OCTEON TX2,僅被 Marvel 稱作“基礎架構處理器”。而最新的 OCTEON 10 平台,則被該公司稱作 DPU 加速器。這種類型的多功能芯片,旨在幫助移動和處理那些通過網絡傳輸的數據。

1.png

在 OCTEON 10 身上,我們不僅看到了與上一代相同的多功能構建塊陣列,還看到了某些先進的 IP、以及一些新功能。比如集成機器學習推理的引擎、內聯加密處理器、以及矢量數據包處理器,且它們都能夠以虛擬化方式運行。

2.png

值得一提的是,OCTEON 10 也是 Marvell 首款採用台積電 N5P 工藝製造的 DPU 芯片。其不僅率先集成了 ARM 的 Neoverse N2 CPU 核心,還支持最新的 PCIe 5.0 I/O 與 DDR5 內存。

作為 DPU 的重要補充,Marvell 還為 OCTEON 10 引入了內部機器學習(ML)引擎。儘管去年完成的早期 IP,最初是為專用型的推理加速應用而打造的。

但在激烈的市場競爭面前,該公司還是決定暫時按下不表,直到將 ML 加速器集成到最新的 OCTEON DPU 芯片中。

3.png

Marvel 指出,將推理加速器放到同一芯片、並直接集成到數據管道中,對於此類數據流用例所需的高吞吐量 / 低延遲處理至關重要。

與此同時,Marvel 正在為英偉達下一代 BlueField-3 DPU 提供優於競爭對手的解決方案,尤其在 AI 處理性能和產能等方面。

據悉,首批 OCTEON 10 產品預計將於 2021 年底前出樣,而英偉達 BF2 則要等到 2022 年。

4.png

此外 OCTEON 10 新系列引入了矢量數據包處理引擎,與當前一代的標量處理引擎相比,它能夠將數據包的處理吞吐量,大幅提升至 5 倍。

如前所述,OCTEON 10 DPU 系列是首款公開宣布採用 ARM 最新的 Neoverse N2 基礎架構的 CPU IP 設計。

AnandTech 在數月前介紹過 N2 與面向高性能計算的 HPC V1,可知與亞馬遜 Graviton2 或 Ampere Altra 相比,其承諾帶來 40% 的性能提升。

5.png

對於 Marvell 而言,在從 TX CPU 核心切換到 N2 之後,其單線程性能亦有望提升 3 倍。2020 年底的時候,該公司已宣布停用自家的 CPU IP,轉而支持 ARM 的 Neoverse 內核。

從 DPU 用例來看,這款 Armv9 CPU 也支持 SVE2,其中包含了有利於數據處理和機器學習功能的重要指令,這點較英偉達 BlueField3 DPU 設計具有很大的優勢(後者仍停留在 Armv8.2+ 的 Cortex-A78 內核)。

6.png

Marvel 還為 N2 配備了完整的緩存選項,包括 64KB L1I 和 L1D 緩存,以及完整的 1MB L2 緩存。不過在網狀網絡解決方案上,Marvell 還是選擇了為該 SoC 集成自家的設計。

這部分的規格相當高,網狀網絡中提供了 256-bit 數據路徑,輔以 2MB 的 L3 共享緩存,並且能夠隨着核心數量的增加而加大。

7.png

在交換集成和網絡吞吐量方面,Marvell 結合了 1 Tbps 交換與多達 16 路 50G MAC 整合到了一起,儘管實際產品 SKU 還是會針對特定場景而有所區分。

AnandTech 指出,OCTEON 10 系列涵蓋了廣泛的應用,從 4G / 5G RAN 數字 / 中央單元、到前傳網關 vRAN 卸載處理器等。

在雲和數據中心用例上,這些解決方案可在計算與網絡吞吐量性能方面,提供廣泛的多功能性。對於企業而言,OCTEON 10 系列亦可提供深度集成的數據包處理和安全加速特性。

8.png

首個 OCTEON 10 產品將基於 CN106XX 設計,在 PCIe 5.0 外形尺寸上提供了 24 個 N2 內核 + 雙路 100GbE QSFP56 端口,

目前 CN106XX 已經完成流片,預計將於 2021 下半年出樣,且有望在 4 季度上市。規格方面,Marvell 對 OCTEON 10 系列的各種設計進行了細分。

比如本文介紹的 DDR5 控制器特指 40-bit 通道(含 8-bit ECC),輔以 SPECint2006 基準測試的性能參考數據。

9.png

此外 Marvell 準備了另外三款 OCTEON 10 SKU,包括僅配備 8 個 N2 內核、TDP 低至 10-25W 的入門級 CN103XX,兩款改進網絡連接的高端款 CN106XXS,以及多達 32 個 N2 內核、運算能力和網絡連接吞吐量都最高的旗艦級 DPU400 。

好消息是,即便是規格最強的產品,其熱設計功耗也只有 60W,遠低於當前一代 CN98XX Octeon TX2 旗艦 SKU 的 80-120W。不過這些產品尚未流片,預計出樣時間為 2022 年。

Marvell 總結道,該公司在 DPU 出貨量方面一直處於行業領先地位,且在所有大型數據中心都有廣泛的部署。隨着全新一代 OCTEON 10 系列產品的到來,其將在性能和效率方面擁有更顯著的競爭優勢。

(0)
上一篇 2021-06-29 14:45
下一篇 2021-06-29 14:46

相关推荐