英特爾開始推出Habana Labs Gaudi2 Linux驅動程序代碼

在上月的 VISION 會議上,英特爾宣布了 Gaudi2 硬件。作為該公司旗下 Habana Labs 用於訓練和推力的第二代加速器,它也同步迎來了開源 Linux 內核驅動 / 用戶空間軟件堆棧更新。英特爾宣稱 Gaudi2 的 AI 訓練性能是英偉達 A100 競品方案的兩倍,且芯片製造工藝也從初代 16nm 升級到了 7nm 。

1.jpg

(via Phoronix)

此外 Gaudi2 迎來了 3 倍的 TPC 改進,32GB HBM2 高帶寬內存增加到了 96GB HBM2e、SRAM 緩存也翻倍到了 48MB,輔以 24×100 GbE 連接,但熱設計功耗(TDP)也從 350W 提升到了 600W 。

在發布一個多月後,Habana Labs Gaudi2 的開源驅動程序工作也在有條不紊地推進中。而當前的 Gaudi2 支持,正好建立在現有的 Gaudi 和 Goya 加速器內核驅動程序(habanalabs)的基礎上。

2.jpg

Habana.ai 白皮書揭示了與 Gaudi2 架構相關的更多信息

從驅動角度來看,Gaudi2 與初代非常接近,整體架構也是一個樣。啟用 Gaudi2 大約需要 15.8 萬行新內核代碼,但其中大部分屬於“頭文件”(AMDGPU 內核驅動程序也有大量頭文件)。

截至目前,新的頭文件主要代表了該主線驅動程序啟用 Gaudi2 支持所需的大部分代碼變動。除了內核驅動工作,英特爾今日還發布了 TPC_LLVM 1.1(針對 Habana Labs 加速器的新版開源編譯器)。

3.jpg

TPC_LLVM 1.1 添加了對 Gaudi2 及新的 Greco ASIC 編譯器的支持

與此同時,英特爾也在努力更新 SynapseAI Core for Gaudi2 開源組件,新補丁系列用於新的 Gaudi2 內核驅動程序代碼。

鑒於新版是從相同的 Gaudi 架構演變而來,預計後續的代碼審核工作也會相當順利,那樣我們就有望在 v5.20 內核周期內儘快添加對 Intel Gaudi2 的支持。

最後,英特爾還在 VISION 2022 會議上宣布了從 Goya 升級而來、針對深度學習應用而作出效率優化的 Greco 加速卡。

(0)
上一篇 2022-06-28 14:24
下一篇 2022-06-28 14:24

相关推荐