歐洲LUMI超算新進展:代碼移植與開源調優仍在繼續 2022年中上線

位於芬蘭的 LUMI 超級計算機仍在組裝過程中,但項目團隊已經介紹了他們的最新進展。據悉,由 AMD 提供技術支撐的這套裝置,一共有 2560 個計算節點。每個節點包括一枚 64 核心的 Trento CPU、以及四路 Instinct miMI250X GPU 加速卡。

0.jpg

(圖自:lumi-supercomputer.eu)

按照原計劃,擁有 375+ PFLOPs 算力的 LUMI 超算本該在 2021 年底前上線。但受供應鏈短缺的挑戰,最新目標已設定在 2022 年中期全面上線。

雖然硬件仍處於組裝過程中,但高性能計算(HPC)工程師一直在努力優化開源 Linux 軟件堆棧。

作為 CSC 的首席 HPC 科學家,Georgios Markomanolis 曾於去年 2 月發表過一次很棒的演講。

期間提到了 Radeon Open eCosystem 的現狀,以及他們經手的所有移植工作 —— 包括讓傳統上以 NVIDIA 為中心的 HPC 工作負載,也能夠在那時的 AMD 測試硬件上工作。

早期規劃使用的是 Instinct MI100 GPU 加速卡,但 LUMI 也在等待 MI250X 的落地成熟。

1.jpg

(圖 via Phoronix)

在上周末的 FOSDEM 2022 大會期間,Georgios Markomanolis 又分享了他們在過去一年的開源軟件工作新進展。

可知 HPC 工程師們已經對面向 GPU 計算的 AMD ROCm 開源軟件堆棧使用得更加技術純熟。

同時繼續在 HIP 上努力將更多 CUDA 代碼庫移植到 AMD GPU 支持軟件中。

然後努力對代碼進行微調,以便在 AMD 硬件上順暢運行。

2.jpg

而在過去一年裡被添加到工具包中的新軟件組件,值得一提的就包括 AMD 的 GPUFort 開源項目。

其旨在幫助開發者將 OpenACC 和 CUDA Fortran 代碼,遷移到以 AMD 為主的架構中。

儘管相關工作仍相當複雜,但通過將相關代碼庫移植到 AMD ROCm 空間,應用程序可獲得最佳的 GPU 性能表現。

最後,對 LUMI 上線運營的具體事務感興趣的朋友,可移步至 FOSDEM.org 查閱更多正在進行 CSC 開源移植和調優工作。

(0)
上一篇 2022-02-10 10:11
下一篇 2022-02-10 10:11

相关推荐