等你24年了 Intel Arc銳炫獨立顯卡深入解讀

3月30日晚,Intel終於發布了預熱良久的Arc銳炫系列獨立顯卡,代號Alchemist(鍊金術師)。Intel的上一款高性能遊戲獨立顯卡,還要追溯到1998年的i740,但是曇花一現之後就沒了,後來的Larrabee獨顯計劃也沒能開花結構(除了衍生出短命的Xe Phi加速卡)。

現在,24年過去了,Intel終於回歸遊戲顯卡!

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Intel Arc顯卡包括3、5、7三大系列,分別定位主流遊戲、性能遊戲、發燒遊戲。

首批登陸筆記本移動端(後續陸續進入桌面台式機和工作站),而首發的是主流的3系列,5、7系列將在今年初夏面世。

平台搭檔主力是12代酷睿H45、P28系列高性能處理器,也入圍了Intel Evo嚴苛認證。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

【型號/規格/性能:最高飆到150W】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Arc A系列有大小兩種不同的GPU芯片,其中大的編號“ACM-G10”,擁有32個Xe核心(可以粗略地理解為512執行單元)、32個光追單元、16MB二級緩存,搭配256-bit GDDR6顯存,支持PCIe 4.0 x16。

小的編號“ACM-G11”,8個Xe核心,8個光追單元,4MB二級緩存,96-bit GDDR6顯存,支持PCIe 4.0 x8。

它們都具備2個Xe媒體編解碼引擎、4個顯示通道。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

產品方面,Arc 3系列首發兩款型號,高端的Arc A370M核心頻率1550MHz,64-bit 4GB顯存,功耗範圍35-50W。

Arc A350M精簡到6個Xe核心、6個光追單元,核心頻率降至1150MHz,顯存不變,功耗範圍則是25-35W。

Arc 5系列目前僅一款型號Arc A550M,16個Xe核心、16個光追單元,核心頻率僅900MHz,搭配128-bit 8GB顯存,功耗60-80W。

Arc 7系列將有兩款型號,滿血的是Arc A770M,32個Xe核心(512執行單元)、32個光追單元,核心頻率高達1650MHz,配備256-bit 16GB顯存,功耗範圍高達120-150W。

Arc A730M精簡到24個Xe核心、24個光追單元,核心頻率1100MHz,顯存降至192-bit 12GB,功耗80-120W。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

值得一提的是,Arc顯卡的核心頻率並不是固定的,而是有一個動態範圍,可以根據不同負載自動調節,規格表中的頻率只是一個平均值。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

性能方面,Arc A370M顯卡搭配i7-12700H處理器,1080p中等畫質下,大部分主流遊戲都可以穩定超過60FPS,《GTA5》、《火箭聯盟》等則可以超過90FPS。

對比12代酷睿i7-1280P中集成的96個執行單元、1450MHz頻率的銳炬Xe核顯,綜合遊戲性能高出一倍左右。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

而在內容軟件中,得益於優化適配,性能提升幅度最多可以達到1.4倍。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

目前,基於Arc A300M系列的筆記本正在陸續問世,品牌包括宏碁、華碩、戴爾、海爾、惠普、聯想、微星、三星、藍天、聞泰等等,Intel NUC迷你機也會加入。

在國內市場,Arc筆記本將從下個月開始上市。

【內核架構:這次完全變了】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Intel Arc銳炫顯卡基於高性能的Xe HPG架構,基本組成單元包括Xe內核、Xe媒體引擎、Xe顯示引擎、Xe圖形流水線等,我們逐一來看。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

大家知道,Intel GPU多年來的基本模塊一直都是“執行單元”(EU),Xe HPG架構上變成了全新的“Xe核心”(Xe Core)。

Xe核心中又包含16個256位矢量引擎(XVE)、16個1024位矩陣引擎(XMX)、192KB共享緩存、載入存儲單元等等,其中緩存可以根據工作負載,在一級緩存、共享本地內存(SLM)之間動態分配。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Xe核心的上一層級是渲染切片(Render Slice),每個包含4個Xe核心、4個光追單元、4個紋理採樣器、幾何前端、光柵前端、HiZ單元、2個像素後端。

渲染切片可以多組結合擴展,Arc顯卡最多有8個。

Arc顯卡完整支持DX12 Ultimate、Vulkan,並且同時支持DXR光追、Vulkan光追。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

這就是Arc顯卡完整的內部架構圖。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

矢量引擎改進了ALU單元,提供專用的FP浮點執行接口,共享的INT/EM整數執行接口,每個時鐘周期可以執行16個FP32操作、32個FP16操作、64個INT8操作。

由於AI算法核心幾乎完全圍繞矩陣乘法、累加算法,所以Xe核心裡加入了單獨的矩陣引擎,專門用於執行XMX指令。

它具備獨立的執行端口,每個時鐘周期可以執行128個FP16/BF16操作、256個INT8操作,512個INT4/INT2操作。

【XeSS:化腐朽為神奇的超分辨率縮放】

針對矩陣引擎不同指令的處理操作,Intel也做了詳細的解釋,我們來簡單了解下。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

MAC作為圖形渲染中的基本SIMD矢量指令,也是Xe矢量引擎的核心,可以執行8次并行乘法,然後執行8次并行加法,每個時鐘周期就是16個操作。

上圖最左側水平方向的前排、後排藍色方塊,就代表操作數,上下的方框則代表累積的源和結果。

DP4a指令是針對不需要32位精度的AI計算所做的優化,工作原理是將所有32位輸入分成8位塊,然後獨立執行,總共32次并行乘法(紫色方塊),每個時鐘周期就是64個操作,相比標準SIMD MAC提高了4倍。

XMX指令也是每個操作分成4個塊,然後獨立相乘、累加,共有64個操作,每個時鐘周期4個階段就是256個操作,由此帶來16倍的算力提升。

XMX矩陣引擎最直接的作用就是支撐XeSS超採樣抗鋸齒技術,類似NVIDIA DLSS、AMD FSR,可以通過低分辨率渲染、高分辨率縮放輸出,提升遊戲性能,並得到類似或超越原生的畫質。

f7a434db52524ff8a15c87d37347a022.png

XeSS已經得到了十多款遊戲的支持,不過目前還不可用,會在今年初夏正式面世。

下邊感受一下XeSS在實際遊戲中的效果,左側是1080p原生渲染,右側是4K XeSS縮放渲染,可以明顯看到後者的畫面質量高得多,細節也更加豐富、銳利。

至於性能提升幅度,Intel暫時沒有給出具體數據。

929c8902a9c240678b1c6b32d9980bae.jpg

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

【多媒體:首發全新視頻格式AV1】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Xe媒體引擎可以為主流視頻軟件帶來硬件加速,解碼支持高達8K60 12-bit HDR,編碼支持高達8K 10-bit HDR。

視頻編解碼格式不但支持MPEG-4、VP9、AVC、H.264、HEVC(H.265),更是首發支持AV1硬件編碼、解碼。

AV1的編碼效率相比H.264、H.265分別高出50%、20%,能夠以更小的文件、更少的帶寬帶來更高的畫面質量,關鍵是開放的,無需版權費,是開放媒體聯盟力推的技術。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

這個聯盟的成員都是大名鼎鼎的巨頭,包括亞馬遜、蘋果、ARM、思科、Facebook、Google、華為、Intel、微軟、Mozilla、Netflix、NVIDIA、三星、騰訊等等。

AV1還在起步階段,但普及速度很快,尤其是解碼方面,NVIDIA RTX 30系列、AMD RX 6000系列,聯發科天璣1000開始,Windows 10系統和不少視頻軟件、視頻網站、視頻設備,都已經支持。

來對比一下AV1、H.264在遊戲直播中的畫質差異,分辨率都是1080p,碼率都是5Mbps。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

【顯示:支持平滑同步】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Xe顯示引擎支持HDMI 2.0b、DisplayPort 1.4a輸出標準,並且為下一代DisplayPort 2.0 10G做好了準備。

視頻輸出也支持極高的分辨率、刷新率,最高可以雙路8K60 HDR、四路4K120 HDR,以及1080p360、1440p360。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

同步技術更是帶來了三種,最常見的是VESA標準的Adaptive Sync(適應性同步),與顯示器刷新率同步,消除畫面撕裂,當今多數遊戲本的屏幕都支持該技術。

其次是Speed Sync(加速同步),可以在關閉V-Sync垂直同步后,為當前幀提供加速,不僅可以消除撕裂,還具備低延時、無上限的優點。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

最後是新的“Smooth Sync”(平滑同步),通過抖動過濾功能,對畫面撕裂進行模糊化處理,保證同步無撕裂、無失真。

【Deep Link:CPU+GPU協同發力】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

處理器、顯卡都是自己家的,自然要聯合作戰,這就是Deep Link技術,可以讓酷睿處理器、核顯、獨顯協同釋放各自的潛力,主要應用包括三個方面。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

一是動態功率共享,支持12代酷睿平台,原理很簡單,就是根據不同的負載,動態調節CPU、GPU的功耗配比,玩遊戲就多給GPU。

AMD平台有相同的技術SmartShift,NVIDIA也有類似的,但自己沒有CPU處理器,效果自然大打折扣。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

二是超級編碼通過oneVPL API,可以讓獨立顯卡、核芯顯卡共同進行視頻編碼,處理不同的幀畫面,再合成。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

三是超級算力聯合基於機器學習的MLS框架,結合XMX引擎加速,可以智能地將計算負載分配給獨立顯卡、核芯顯卡各自的計算引擎,比如處理視頻的時候,將畫面分成不同區塊,交給兩種顯卡,處理完畢后再合成輸出。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

Intel宣稱,在內容創作上,動態功率共享、超級編碼、超級算力可以分別帶來最多30%、60%、24%的性能提升。

Intel也展示了超級算力的應用實例,將低畫質的視頻AI處理縮放到高分辨率畫質。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

【驅動面板:煥然一新 監控優化都在行】

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

硬件有了,驅動自然也要跟上,Arc顯卡將搭配全新的“Arc Control”驅動控制面板,功能更加豐富,包括遊戲驅動、性能調優、全局設置、遊戲庫、創作者工作站等模塊。

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

性能調優部分,可以實時監測查看各種硬件指標,頻率、電壓、佔用率、溫度、風扇轉速等等,還可以設置監測塗層,隨時覆蓋查看。

未來的桌面產品,還會支持調節功耗、風扇轉速等,不知道是否會加入超頻……

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

創作者工作站部分,可以方便地進行直播、AI攝像頭強化(背景模糊/背景替換/刪除和自動補幀等)、自動生成遊戲高光時刻。

等了這麼久,Intel高性能獨立顯卡終於來了,你準備好了嗎?

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

等你24年了 Intel Arc銳炫獨立顯卡深入解讀

(0)
上一篇 2022-03-30 23:48
下一篇 2022-03-30 23:51

相关推荐