發表日期 3/31/2022, 6:14:46 PM
盼星星盼月亮,時隔24年之後,英特爾終於再次揮師獨立顯卡領域,代號為“Alchemist”(煉金術師)的Arc銳炫係列(具體型號為Arc AxxxM)獨立顯卡正式發布。
英特爾獨顯曆史迴顧
24年前(1998年),在3dfx、ATI、NVIDIA、S3、Trident和Matrox爭雄的戰火紛飛年代,英特爾就曾推齣過自主品牌的獨立顯卡――Intel i740。這顆GPU是英特爾以通過購買Real3D公司20%股權為代價,與其攜手閤作定製的産品,從而以較小的代價迅速進入瞭3D圖形市場。
隨後,i740被英特爾優化之後整閤進瞭810/815芯片組(改名為i752),這種集成在芯片組內的GPU核心從此有瞭一個正式的名號――“集成顯卡”。
可惜,Real3D公司在1999年時倒閉,直接影響瞭英特爾後續獨立顯卡的規劃,再加上以NVIDIA和ATI(後來被AMD收購)為代錶競爭對手的強勢,逼得英特爾不得不將主要精力投入到整閤集成顯卡性能的挖掘之上,而i740在經曆短暫的輝煌之後也就成為瞭Intel品牌的絕唱。
至此,英特爾便在集成顯卡的道路上一路狂奔,直到Arc銳炫係列獨立顯卡的迴歸。
口碑崩塌的銳炬Xe Max獨顯
實際上,英特爾在2020年曾發布過一款獨顯,具體型號是銳炬Xe Max,並被宏��非凡S3x輕薄本首發。
本質上,銳炬Xe Max其實就是i7-1165G7、i5-11320H等(包括第12代)酷睿處理器集成銳炬Xe 96核顯的獨立封裝版,它們都擁有96個EU單元(768個流處理器)、48個紋理單元以及24個ROP光柵單元。
銳炬Xe Max采用瞭獨立封裝設計,所以它可以搭配高達4GB的LPDDR4X獨立顯存,獨享25W TDP,因此可以將核心頻率從Iris Xe核顯的1350MHz提升到1650MHz,也因此可以獲得更理想的性能底蘊。
可惜,至少在宏��非凡S3x輕薄本身上,銳炬Xe Max獨顯的錶現隻能用拉胯形容,實際性能還不如搭配LPDDR4X-4267的銳炬Xe 96核顯。
本圖來自數碼博主@金豬升級包
最關鍵的是,人傢銳炬Xe 96核顯和處理器一體,無須額外的功耗開銷,而銳炬Xe Max獨顯在搭配處理器後,需要筆記本同時為CPU和獨顯供電,性能沒提升也就罷瞭,還導緻續航時間的血崩。
因此,對英特爾來說,銳炬Xe Max不提也罷。
英特爾獨顯,還得看Arc銳炫的錶現。
Arc銳炫獨顯一門三劍客
英特爾Arc銳炫獨顯的野心很大,針對主流遊戲、性能遊戲、發燒遊戲,衍生齣瞭Arc 3、Arc 5和Arc 7三大係列。
其中,英特爾Arc 3係列將於下月量産上市,包含Arc A350M和Arc A370M,主要用於搭配第12代酷睿P係列處理器,與AMD旗下的Radeon RX 6300M獨顯、銳龍6000係列集成的Radeon 680M核顯以及NVIDIA旗下的GeForce MX550級彆獨顯競爭。
英特爾Arc 5和Arc 7係列則預計在今年初夏麵世,Arc 5的競爭對手主要是RTX 2050/RTX 3050Ti係列,而Arc 7則用來狙擊RTX 3060以及更高端的獨顯。
從今天開始,除瞭“3A”筆記本,我們又有瞭“3i”筆記本可選。
Arc銳炫獨顯的基本構成
英特爾現有銳炬Xe核顯采用的是高效能的Xe LP架構,而Arc銳炫獨顯則改用高性能的Xe HPG架構。
Xe LP架構核顯結構
包括銳炬Xe核顯在內,英特爾曆代核芯顯卡的基本模塊都是“EU執行單元”,比如銳炬Xe 80和銳炬Xe 96就分彆代錶集成80個以及96個執行單元。EU單元數量越多,性能越強。
Arc銳炫獨顯采用的Xe HPG架構,其基本模塊則變成瞭“Xe內核”(Xe Core),每個Xe內核中都包含瞭16個256位矢量引擎(XVE)、16個1024位矩陣引擎(XMX)、192KB共享緩存和載入存儲單元等等,其中緩存可以根據工作負載在一級緩存、共享本地內存(SLM)之間動態分配。
每個Xe內核可以粗略地理解為16個執行單元。
每4個Xe內核可以構成一組完整的“渲染切片”(Render Slice),每組渲染切片中除瞭4個Xe核心以外還包含4個光追單元、4個紋理采樣器、幾何前端、光柵前端、HiZ單元以及2個像素後端等,不僅支持DX12 Ultimate和Vulkan,還同時支持DXR光追和Vulkan光追技術。
Arc銳炫獨顯最多可以集成8組渲染切片。
Arc銳炫獨顯的型號詳解
英特爾Arc銳炫獨顯中的不同型號,其實就是由不同數量的渲染切片堆疊而成。簡單來說,Arc銳炫獨顯提供瞭2種封裝版本,其中的滿血版,也就是“超大杯”的芯片編號為“ACM-G10”,最多集成8組渲染切片,也就是32個Xe內核(512個執行單元)、32個光追單元和16MB二級緩存,可搭配256bit GDDR6顯存,支持PCIe 4.0 x16連接通道。
Arc銳炫獨顯的另外一種封裝,也就是“小杯”的芯片編號為“ACM-G11”,集成最多2組渲染切片,包含8個Xe內核(128個執行單元)、8個光追單元和4MB二級緩存,搭配96bit GDDR6顯存,支持PCIe 4.0 x8連接通道。
無論超大杯還是小杯,Arc銳炫獨顯都還配備瞭2個Xe媒體編解碼引擎以及4個顯示通道。
在Arc 3係列中,Arc A370M采用的就是“ACM-G11”封裝芯片,擁有完整的8個Xe內核(等效128個執行單元)和8個光追單元,但是它的顯存位寬卻降到瞭64bit,核心頻率1550MHz,功耗範圍在35W~50W之間。
Arc A350M則是在A370M的基礎上屏蔽瞭2個Xe內核,隻剩下6個Xe內核(等效96個執行單元)和6個光追單元,顯存位寬同樣是64bit,但核心頻率也降至1150MHz,功耗範圍在25W~35W之間。
Arc 5係列和Arc 7係列都采用瞭“ACM-G10”封裝芯片,其中Arc 5係列暫時隻有Arc A550M一款型號,它內置4個渲染切片,包含16個Xe內核(等效256個執行單元)和16個光追單元,核心頻率為900MHz,可搭配128bit位寬的8GB GDDR6顯存,功耗提升到60W~80W。
Arc 7係列中的滿血型號為Arc A770M,擁有完整的8組渲染切片,包含32個Xe內核(等效512個執行單元)和32個光追單元,核心頻率高達1650MHz,可搭配256bit位寬的16GB GDDR6顯存,但功耗也高達120W~150W。
Arc A730M則在A770的基礎上屏蔽瞭2組渲染切片,包含24個Xe核心(等效384個執行單元)和24個光追單元,核心頻率為1100MHz,顯存192bit位寬和12GB,功耗範圍80W~120W。
Arc銳炫獨顯的特色功能
需要注意的是,Arc銳炫獨顯的核心頻率可以根據負載自動調節,前麵提到的頻率隻是一個平均值。
由於Arc銳炫獨顯必然搭載英特爾自傢的第12代酷睿處理器,所以英特爾也為自傢的CPU和GPU準備瞭Deep Link技術,可以讓它們更高效地協同作戰,釋放潛力。
Deep Link技術支持動態功率共享,即根據不同的負載,動態調節CPU和GPU的功耗配比,比如在遊戲場景下會將更多的功耗分配給GPU,與AMD旗下SmartShift技術的原理相似。
Deep Link技術還支持超級編碼,通過oneVPL API可以讓Arc銳炫獨顯和銳炬Xe核顯共同進行視頻編碼,處理不同的幀畫麵再進行閤成。
Deep Link技術還擁有超級算力,基於機器學習的MLS框架,結閤XMX引擎加速,可以智能地將計算負載分配給Arc銳炫獨顯,以及銳炬Xe核顯內各自的計算引擎,比如讓它們共同處理視頻畫麵中的不同區塊,處理完畢後再閤成輸齣。
根據官方的數據顯示,第12代酷睿處理器+Arc銳炫獨顯,在內容創作的應用場景裏,動態功率共享、超級編碼、超級算力可以分彆帶來最多30%、60%和24%的性能提升。
通過XMX矩陣引擎,讓Arc銳炫獨顯原生支持更高效的XeSS超級采樣技術,其原理與NVIDIA DLSS和AMD FSR相似,都是基於AI提升高分辨率環境下的遊戲流暢度,也就是通過低分辨率渲染+高分辨率縮放輸齣,提升遊戲幀數並得到類似或超越原生的畫質。
Arc銳炫獨顯內置的Xe媒體引擎也很厲害,它支持最高8K60 12bit HDR解碼或最高8K 10bit HDR編碼。其視頻編解碼格式除瞭支持常見的MPEG-4、VP9、AVC、H.264、HEVC(H.265)以外,還首次支持完整的AV1硬件編碼和解碼。
目前Adobe Premiere Pro、DaVinci Resolve 等知名視頻編解碼軟件也已經宣布支持英特爾ARC AV1硬件加速。這意味著對於搭載Arc銳炫獨顯的輕薄本而言,哪怕沒有搭配集成NVENC編碼器的NVIDIA RTX係列獨顯,也能獲得高效率的視頻剪輯和輸齣能力。
AV1現在正在普及的前夕,它的編碼效率相比H.264、H.265分彆提升瞭50%和20%,能以更小的文件和更少的帶寬帶來更高的畫麵質量。由於該標準是免費開放的,所以,包括亞馬遜、蘋果、ARM、思科、Facebook、Google、華為、Intel、微軟、Mozilla、Netflix、NVIDIA、三星、騰訊等行業巨頭都在聯手推動。
以AV1、H.264兩種技術在遊戲直播中的畫質為例,在分辨率都是1080P+5Mbps碼率下,AV1的畫質較之H.264有瞭顯著的提升。
Arc銳炫獨顯內的Xe顯示引擎也同步升級。針對遊戲用戶,它支持Adaptive Sync、Speed Sync、Smooth Sync三種同步技術。Adaptive Sync針對可變刷新率顯示器,會在進行遊戲的時候將畫麵輸齣速率和顯示器刷新速率進行同步,防止畫麵撕裂;Speed Sync負責為當前幀提供加速,會降低畫麵刷新延遲;Smooth Sync則是針對固定刷新率顯示器,通過抖動過濾功能對畫麵撕裂進行模糊化處理,提升遊戲沉浸感。
此外,Arc銳炫獨顯的Xe顯示引擎還支持HDMI 2.0b和DisplayPort 1.4a輸齣標準,並做好瞭迎接下一代DisplayPort 2.0標準的準備。新顯卡支持最高雙路8K@60 HDR、四路4K@120 HDR,以及1080P@360和1440P@360。
最後,英特爾還為Arc銳炫獨顯打造瞭全新的圖形控製麵闆,在裏麵可以進行性能監測、驅動更新、性能調校、視頻錄製、高光時刻自動抓取或是直播等功能。
Arc銳炫獨顯的性能依舊神秘
英特爾對Arc銳炫獨顯的性能部分錶述比較含糊,僅曝光瞭Arc A370M與i7-1280P集成銳炬Xe 96核顯之間的性能較量,而且沒有注明與處理器搭配的內存規格(LPDDR5-5200纔是真滿血),還沒有注明核顯平台的具體幀數。
具體來說,Arc A370M獨顯搭配i7-12700H處理器時,能在1080P+中等畫質下流暢駕馭大部分入門級遊戲,但從柱狀圖來看也談不上對Xe 96核顯的秒殺,隻有在堡壘之夜Fortnite等極少數遊戲中的領先幅度特彆大。
在內容創作環境中,有瞭Arc A370M獨顯加持的i7-12800H平台,較之依靠i7-12800H單打獨鬥,可以獲得30%~140%的性能提升,這個幅度還是比較可觀的。
總的來說,大傢不要對Arc A370M獨顯在遊戲中的錶現抱有太大的預期,它最多也就是Radeon 680M核顯以及GeForce MX550獨顯的水平,甚至可能還略有不如,否則英特爾也不會隻拿自傢的核顯對比,還沒有標注具體的幀數。
三星和宏��會成為首發Arc A370M獨顯的筆記本品牌,隨後華碩、戴爾、海爾、惠普、聯想、微星、藍天、聞泰和Intel NUC迷你機也會陸續加入。
那麼,你期待時隔24年後的英特爾新獨顯嗎?