最近,微軟Azure通過提供30.05Petaflops加入了TOP500超級計算機排名的Top10俱樂部。它基於微軟最近宣布的Azure
NDm A100 80GB v4構建,並可按需提供和擴展。這些Azure NDm A100 v4實例由NVIDIA GPU加速和NVIDIA
InfiniBand網絡驅動。
微軟今天強調了最新(2021年12月)的MLPerf 1.1結果,其中Azure的整體性能排名第二,雲提供商的性能排名第一:
在2048個GPU上訓練BERT大型自然語言處理模型約需25秒
使用2048個GPU的Resnet50 1.5圖像分類,每秒鐘處理多達380萬張圖像
使用1792個GPU在17.5分鐘內完成了Minigo(強化學習)基準測試。
上述結果展示了Azure對使用雲計算進行人工智能訓練的規模和性能。
最新的MLPerf訓練v1.1基準輪收到了來自14個組織的提交材料,併發布了超過185個經同行評審的機器學習系統的結果,範圍從邊緣設備到數據中心服務器。本輪提交的資料包括來自Azure、百度、戴爾、富士通、技嘉、Google、Graphcore、HabanaLabs、HPE、浪潮、聯想、英偉達、三星和超微的軟件和硬件創新。
您可以在這裡找到完整的結果:
https://mlcommons.org/en/news/mlperf-training-v11/