在 AMD 和英特爾早就高調披露 Frontier / Aurora 百億億級超算項目的同時,我國也通過加強版的自研處理器 + 加速器架構,在兩套平台上率先邁過了 ExeFlops 的里程碑。首先,無錫國家超算中心或很快公布一些有關即將推出的國產 Sunway 超級計算機在量子模擬任務方面的驚喜成果。除了算力,新機器在 HPC 架構和絕對規模方面也相當值得關注。
網頁截圖(來自:NSCCWX.CN / 國家超算無錫中心)
長期以來,國際超算社區一直在密切關注全球 Top500 名單的變動。相比之下,國內研究團隊的新聞披露要低調務實許多。
比如 The Next Platform 指出,我國已在 2021 年內越過了 true / LINPACK 的百億億級(ExaFlops)里程碑 —— 而且不止在一套超算平台上完成了這項工作。
一位不願透露姓名的傑出權威人士透露,Sunway“Oceanlite”系統在 2021 年 3 月跑了一次 LINPACK,且該系統是排名第 4 的神威·太湖之光的後續產品。
可知其在理想的 35 兆瓦(MegaWatt)的甜點功率區間,達成了 1.3 ExaFlops 的峰值 / 1.05 ExaFlops 的持續性能。
資料圖(2016 年 6 月 / Top500 證書)
今年早些時候,The Next Platform 已經分先過有關 Sunway Oceanlite 架構的少量細節。
然後根據年度超算大會(SC21)前匯總的多方爆料,其推測新機的規模略有縮小,輔以翻倍的插槽數量和性能表現。
預計在 4200 萬個內核的并行運算下,新平台可達成持續的 ExaFlops 性能,並為量子模擬等工作任務提供強勁的支撐。
此外新平台突出了混合精度數學的廣泛使用(4.4 ExaFlops @ FP16 半精度性能),對人工智能(AI)/ 機器學習(ML)的訓練和推理工作負載亦有極大的幫助。
至於另一套百億億級 HPC 系統的更多細節,目前僅知它同樣基於自研平台,且與 Oceanlite 屬於兩套不同架構的獨立平台。
相關文章:
3.6萬CPU核心、1550萬GPU核心:AMD+NVIDIA打造世界第一AI超算
英特爾預估Aurora超算具有超過2 ExaFlops的FP64性能