GDC 2022:英特爾詳解ARC Alchemist GPU的XeSS與光追性能優勢

GDC 2022 大會期間,英特爾舉辦了多場會議,其中詳細介紹了 ARC Alchemist GPU 支持的各項功能,比如 XeSS 和光線追蹤,及其如何較競爭對手帶來更好的性能與圖像質量。儘管這不是我們首次談論,但該公司確實分享了一些新的細節和性能指標。首先聊聊 XeSS,作為藍廠的超級採樣技術,其利用了機器學習將低分辨率幀重構為高分辨率,且運行渲染開銷僅為 4K 等更高分辨率的一小部分。

1.jpg

(via WCCFTech)

XeSS 的核心原理是通過 ARC Alchemist GPU 的 Xe-Cores 上集成的 XMX AI 加速硬件,來充分發揮機器學習的效用。

2.png

英特爾聲稱 XeSS 優於 Temporal Upscaling 2 方案

該方案與 DirectX 12 完全兼容,且適用於英特爾 ARC SIMD 架構上運行的基於矢量着色語言的神經網絡(NN)。

3.jpg

與原始 4K 分辨率相比,使用 XMX 的 XeSS 4K 渲染場景、開銷不到前者的一半。該技術還符合 DP4a 標準,這意味着它能夠在沒有 XMX 等 AI 或 ML 加速引擎的 GPU 上運行,輔以相近的性能和圖像質量。

4.png

與 TAAU 等升級方案相比,XeSS 以最少的偽影(如閃光)來消除各種重影,帶有內置的銳化引擎以取代 TAA 。此外與超級採樣或空間升級方案相比,XeSS 能夠在不影響質量的情況下實現更高的縮放比例。

5.png

英特爾還分享了一個全新的 XeSS Rens 演示,選擇了在固定頻率的英特爾 ARC Alchemist GPU 上運行光追 / 五檔不同的 XeSS 預設分辨率(超性能、性能、平衡、質量、超質量)。

6.png

可知在Ultra 性能模式下,其能夠帶來 2.53 倍的性能提升,Ultra Quality 更是能夠在 4K 分辨率下實現較原生高 27% 的性能提升。

7.jpg

英特爾繼續深入自家光追方案,及其如何較英偉達 / AMD 的競爭方案更具優勢。比如繞過針對命中着色器、紋理的 SIMD 發散,並使用一組硬件分類來處理光線和線程,以最大限度地延長每個通道的正常運行時間。

8.png

如此一來,英特爾 ARC Alchemist GPU 的光追方案,本質上就更貼近於自動加速硬件。在一張通過預生產顯卡跑出的性能指標 PPT 中,我們看到 GPU 在 RayQuery(relative)vs DXR1.0 對比中具有 0.775 的性能表現。

9.png

英特爾還解釋了出現這種情況的原因,以及為何會在自家 GPU 上看到這種性能下降。之後該公司討論了如何在遊戲引擎中利用 12 代 Alder Lake CPU 中引入的混合式核心架構設計。

10.png

據悉,Intel 與 IO Interactive 一直在 CPU / GPU 優化上努力,以便開發者能夠充分利用 AI 加速、角色動畫、物理、碰撞、音頻處理等後台任務,在適當情況下積極調用單線程性能更具優勢的 P 核。

11.png

以《Hitman 3:Dartmoor》遊戲為例,英特爾展示了在啟用高性能 P 核 / 節能 E 核的情況下的對比表現。可知 12 代 Alder Lake CPU 的混合架構具有 +4% 的平均幀速率優勢,九成情況下可將 FPS 提升 12%、一成情況下降低了 2% 。

12.png

不過最大的改進,還是在其物理框架內 —— 等待時間減少了 55%( 90% @ 1.7 ms),整體幀時間減少了 25% —— 由於需要在渲染線程上等待,較快的幀確實會減慢一點。

當然,上述只是 Intel 官方給出的初步細節。至於更多內容,還請耐心等待 3 月 29 日正式推出首批 ARC Alchemist GPU 后再開展實戰檢驗。

(0)
上一篇 2022-03-25 10:03
下一篇 2022-03-25 10:04

相关推荐