CERN團隊期待GPU計算集群可為LHC新實驗提供強大助力

對於傳統計算機架構來說,想要每秒分析多達 10 億次質子碰撞、或數萬次極其複雜的鉛碰撞,顯然並非易事。隨着大型強子對撞機(LHC)Run 3 數據處理需求的飆升,歐洲核子研究中心(CERN)也正通過四個大型實驗項目,來探索通過 GPU 改善其計算基礎設施的方法。

1.jpg

(圖自:CERN)

據悉,LHC 實驗的最新升級,即將於 2023 年投入使用。

考慮到傳統中央處理器(CPU)難以應付新的計算挑戰,目前正有四個大型項目在嘗試採用 GPU 并行計算方案。

圖上圖所示,某 Run 3 候選 HLT 節點裝配了雙路 AMD Milan 64 核 CPU + 兩張英偉達 Tesla T4 GPU 。

GPU 在圖像處理等應用場景下具有極高的效率,最初只是為了加速計算機 3D 圖形渲染而打造。

但在過去的幾年裡,LHC 實驗、全球 LHC 計算網格(WLCG)和 CERN openlab 就已展開過這方面的研究嘗試。

而在高能物理應用中加大 GPU 的計算投入,不僅能夠提升 CERN 計算基礎設施的質量和規模,還有助於提升系統的整體能效。

2.jpg

鉛-鉛碰撞的 2 ms 可視化呈現(圖自:ALICE TPC / CERN)

CERN IT 部門負責人 Enrica Porcari 表示:

LHC 雄心勃勃的升級計劃,帶來了一系列令人興奮的計算挑戰。好消息是,GPU 能夠在機器學習(DL)方面提供有力的支撐,幫助研究人員解決許多問題。

自 2020 年以來,CERN IT 部門提供了對數據中心 GPU 平台的訪問權限,其已被證明在一系列應用中很受歡迎。

更重要的是,CERN openlab 正通過與工業界的合作研發項目,對將 GPU 用於機器學習一事展開鄭重深入的調查。

與此同時,CERN 的科學計算協作小組,目前正努力幫助移植和優化實驗中的關鍵代碼。

多年前,ALICE 項目就率先在其“高級觸發在線計算機農場”(HLT)中使用了 GPU,但也是迄今唯一大規模運用 GPU 的實驗。

而新升級的 ALICE 探測器擁有超過 120 億個連續讀取的電子傳感器元件,每秒可生成超過 3.5 TB 的數據流。即使經過一級數據處理,數據流量仍高達 600 GB/s 。

這些數據會被放到具有 250 個節點的 HPC 農場展開在線分析,每個節點包含 8 路 GPU + 32 核 CPU 。

大多數情況下,可將單個粒子檢測器信號組裝成粒子軌跡的軟件(事件重建)工作,現均已適應了在 GPU 上并行工作。

從 2022 年開始,LHCb 實驗將處理 4 TB/s 的數據流,並對每秒篩選出的最有趣的 10 GB/s LHC 碰撞數據展開物理分析。

其獨特方法是不卸載工作,而是分析 GPU 上每秒 3000 萬個粒子束交叉點。自 2018 年以來,隨着 CPU 處理的改進,LHCb 的探測器重建能效也提升了將近 20 倍。

目前研究人員正期待着使用 2022 年的首批新系統調試數據,並在此基礎上讓升級后的 LHCb 探測器得以發揮其完整的物理潛力。

(0)
上一篇 2022-02-08 21:21
下一篇 2022-02-08 21:21

相关推荐