A A+ A++

Intel Lunar Lake to dla producenta jeden z najważniejszych projektów ostatnich lat. Skupia w sobie wiele nowych elementów, które mają razem zaoferować wysoką wydajność oraz energooszczędność. Jednym z filarów będzie nowy, zintegrowany układ graficzny, oparty na architekturze Xe2. Już przy generacji Meteor Lake producent pokazał, że w optymalnych warunkach jest w stanie przygotować porządny układ iGPU, zarówno wydajny w grach jak również dopracowany pod kątem obsługi najnowszych silników dla mediów czy wyświetlaczy. Intel Lunar Lake podnosi poprzeczkę wyżej pod każdym względem, a sama architektura zapowiada się ciekawie również dla kart graficznych z rodziny Battlemage.

Intel Xe2 to nowa architektura, zbudowana praktycznie od podstaw. Charakteryzuje się wysoką skalowanością, dzięki czemu może w takiej samej formie zaistnieć w zintegrowanych układach graficznych jak również w desktopowych kartach graficznych z rodziny Battlemage.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [1]

Intel Lunar Lake – oficjalna zapowiedź wysoce energooszczędnych procesorów nowej generacji dla laptopów

Intel Xe2 jako nowa architektura skupia się przede wszystkim na zaoferowaniu znacznie wyższej efektywności energetycznej. W zależności od zadań, firmie udało się to w mniejszym lub znacznie większym zakresie. Przykładowo w obliczeniach opartych na mesh shaders (czyli związanych ściśle z geometrią obiektów), efektywność wzrosła ponad 4-krotnie względem pierwszej generacji Xe. Dla teselacji to 20%, ale już w przypadku Ray Tracingu waha się od 60% do 110% (w zależności czy mowa o przebiegu promieni czy przecinaniu trójkątów). Bardzo wysoki, bo blisko 3-krotny wzrost wydajności i efektywności będzie zauważalny także przy wykorzystaniu Sampler Feedback. Generalnie można odnieść wrażenie, że Intel bardzo mocno usprawnił działanie Xe2 w tych aspektach, które są istotną częścią bibliotek DirectX 12 Ultimate.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [2]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [3]
Po lewej – procesor Intel Lunar Lake, po prawej – desktopowy układ graficzny Battlemage. Oba wykorzystują tą samą architekturę Xe2

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [4]

Charakterystyka mikroarchitektury Lion Cove oraz Skymont dla procesorów Intel Lunar Lake oraz Arrow Lake

Intel Xe2 oferuje znacznie lepszą i bardziej ujednoliconą skalowalność, począwszy od zintegrowanych układów graficznych po najmocniejsze karty dla graczy i rynku profesjonalnego. Xe2 ponownie oferuje bloki Xe-Core umieszczone w większych kafelkach o nazwie Render Slice. Ich konstrukcja została jednak zmodyfikowana. W każdym bloku Xe-Core znajdziemy teraz 8 jednostek Xe Vector Engine (512-bitowe jednostki), zamiast 16 jak to było w poprzedniej generacji. Łącznie, przy 8 blokach Xe-Core w Lunar Lake, do dyspozycji otrzymamy zatem 64 takie jednostki, zamiast 128 jak to było poprzednio. Nie wiemy obecnie, czy modyfikacja sięgnie również tego, w jaki sposób liczone są jednostki cieniujące (przykładowo dla Intel ARC Graphics z 8 Xe-Core / 128 EU było to 1024 SP) – tutaj czekamy jeszcze na zwrotną informację. Z kolei w celu dalszej poprawy efektywności energetycznej i wydajności jednocześnie, zasoby obliczeniowe zostały podzielone w ramach natywnej obsługi SIMD16 dla jednostek ALU. Kolejną zmianą jest natywna obsługa instrukcji Exectue Indirect, będące częścią bibliotek DirectX 12 Ultimate, a które przyspieszają wykonywanie określonych typów zadań.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [5]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [6]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [7]

Procesory Intel Xeon 6 oficjalne zaprezentowane. Nowej generacja jednostek serwerowych zaoferuje nawet 288 rdzeni

Dużą zmianą, ale sięgającą wyłącznie zintegrowanych układów graficznych, będzie implementacja drugiej generacji rdzeni XMX (Xe Matrix Engine) z 2048-bitową magistralą i obsługujące następujące typy obliczeń: INT2, INT4, INT8, FP16 oraz BF16. W przypadku obliczeń dla liczb zmiennoprzecinkowych FP16, rdzenie XMX w Xe2 oferują wydajność na poziomie 2048 operacji na cykl, z kolei dla obliczeń INT8 (8-bitowe liczby całkowite) mowa o 4096 operacjach na cykl. Rdzeni XMX jest tylko samo co XVE (po jednym na każdy Xe-Core), a więc w przypadku zintegrowanego układu graficznego z 8 blokami Xe-Core, otrzymamy po 64 rdzenie Xe Vector Engine oraz Xe Matrix Engine. Dla iGPU jest to spora zmiana, bo zaoferuje znacznie wyższą wydajność we wszystkich zadaniach, opartych na wnioskowaniu AI. Dotyczy to również sprzętowej akceleracji techniki skalowania XeSS, co dotychczas w przypadku zintegrowanych układów graficznych było niemożliwe do zrealizowania. Hardware’owa implementacja XeSS charakteryzuje się wyższym przyrostem wydajności w porównaniu do DP4a jak również lepszą jakością obrazu, zwłaszcza w ruchu. W trakcie naszej rozmowy z Tomem Petersenem uzyskaliśmy jasną deklarację, że w grach oferujących obsługę XeSS, nowe iGPU może uzyskać znacznie lepsze rezultaty dzięki wykorzystaniu sprzętowych jednostek XMX.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [8]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [9]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [10]

Mocno powiększono rdzenie Ray Tracing, które teraz zajmują sporą część powierzchni każdego bloku Render Slice – można by powiedzieć, że powierzchnia każdego rdzenia RT jest niewiele mniejsza od reszty Xe-Core. Większa przestrzeń związana jest jednak ściśle z rozbudowaniem możliwości samych rdzeni RTU (tak oficjalnie są określane przez producenta). Druga generacja oferuje bowiem 18 przecięć typu ray/box BVH (po sześć na potok Traversal) na cykl oraz dwa przecięcia typu promień/trójkąt na każdy cykl. W poprzedniej generacji mieliśmy odpowiednio 12 przecięć typu box oraz jedno typu promień/trójkąt. Tym samym Intel jeszcze mocniej odskakuje AMD w kwestii hardware’owej obsługi śledzenia promieni (przynajmniej pod względem budowy rdzeni do tego wyszkolonych) i coraz bardziej zbliża się do NVIDII.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [11]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [12]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [13]

Podczas panelu poświęconego zmianom w architekturze Xe2 oraz działaniu XeSS, Tom Petersen posłużył się konkretnym przykładem gry wideo. Do testu wybrano niedawno debiutujące wyścigi F1 24. Produkcja została uruchomiona na zintegrowanym układzie graficznym Xe2 w wysokich ustawieniach graficznych, z włączonym Ray Tracingiem na poziomie wysokim oraz z aktywnym XeSS w trybie Performance z wyjściową rozdzielczością Full HD. Układ iGPU był podczas pełnego wyścigu oferować płynność na poziomie 60 lub więcej klatek na sekundę. Sama jakość XeSS w trybie Performance również prezentowała się całkiem znośnie, jednak jak już wspomniałem to pierwsze iGPU ze sprzętową obsługą XeSS. Tak czy inaczej wynik jak na zintegrowaną grafikę – i to jeszcze przed finalną optymalizacją warstwy software – budzi niemały podziw. Jeszcze kilka lat takie rezultaty na iGPU były niemożliwe do uzyskania. Tymczasem Intel raptem z generacji Raptor Lake-H/P/U (Iris Xe Graphics) do generacji Lunar Lake (a więc tylko dwie generacje do przodu, bo pomiędzy jest wyłącznie Meteor Lake) wykonał kawał solidnej roboty. A przynajmniej tak to wygląda po wstępnych oględzinach. Ujednolicenie architektury oraz doświadczenie zdobyte przy dopracowywaniu generacji Alchemist daje jeszcze jeden ważny skutek. Producent podczas omówienia architektury dał jasny sygnał, że w przypadku premiery Xe2 dla iGPU oraz kart Battlemage, poziom sterowników od debiutu będzie stał na wyższym poziomie niż wcześniej.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [14]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [15]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [16]

Jak wygląda zatem ogólna budowa zintegrowanego układu graficznego Intel Xe2 w Lunar Lake? Użytkownicy do dyspozycji dostaną 2 główne bloki Render Slice, w każdym po cztery Xe-Core oraz cztery rdzenie Ray Tracing Unit, dodatkowo z jednostką Thread Sorting Unit (TSU), umieszczoną pomiędzy częścią XVE / XMX, a RTU. Działanie Thread Sorting Unit jest podobne jak poprzednio, a więc odpowiada przede wszystkim za obsługę asynchronicznego Ray Tracingu, pozwalając w efektywny sposób na wykorzystywanie dostępnych zasobów obliczeniowych do akceleracji śledzenia promieni (wyciąganie wyników pracy działania RT, a następnie grupowanie według stopnia ich złożoności). Układ graficzny Xe2 w Lunar Lake otrzyma jeszcze m.in. 64 rdzenie Xe Vector Engine, 64 rdzenie Xe Matrix Engine, dwa potoki dla wspomagania obliczeń geometrii obiektów, osiem samplerów oraz 8 MB pamięci cache L2.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [17]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [18]

Intel Xe2 w Lunar Lake, w zależności od tego, z jakim układem Intel ARC Graphics / Intel Graphics (Meteor Lake) zostanie porównany, będzie oferował do 50% lub mniejszy skok wydajności. Dotyczy to jednak przede wszystkim wydajności w rasteryzacji, ponieważ w rozmowie z Tomem Petersenem otrzymałem dodatkową odpowiedź, że w przypadku wydajności z Ray Tracingiem, wzrosty mogą być większe niż 50%, choć tutaj w dużej mierze będzie to już uzależnione od konkretnej gry. Z racji znacznie lepszej efektywności energetycznej, iGPU w Lunar Lake może zaoferować albo znacznie lepsze osiągi przy tym samym poborze mocy albo zbliżony do Meteor Lake-H poziom wydajności przy odczuwalnie niższym zużyciu mocy. Przy takim samym poborze, Xe2 będzie również mocniejsze od Intel ARC Graphics, jednak w tym wypadku mowa przynajmniej 30% różnicy na korzyść Lunar Lake. Biorąc pod uwagę, że liczba rdzeni Xe Vector Engines uległa zmniejszeniu o 50% względem Xe-LPG, robi to wrażenie.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [19]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [20]

Architektura Xe2 posiada usprawnione rdzenie XMX – w przypadku zintegrowanych układów graficznych w Lunar Lake, moc obliczeniowa dla 64 rdzeni XMX 2. generacji wynosi do 67 TOPS. W trakcie Tech Tour na Tajwanie również zademonstrowano wydajność procesora w środowisku Stable Diffusion (generowanie obrazków na podstawie podanych słów kluczowych). W tym wypadku posłużono się programem GIMP z obsługą bibliotek OpenVINO oraz dwoma laptopami – jeden z Intel Meteor Lake, drugi z Lunar Lake. Nowsza generacja na wygenerowanie obrazka potrzebowała dokładnie 6345.21 ms, podczas gdy Meteor Lake ten sam test wykonał w czasie 13290.45 ms. Intel Lunar Lake okazał się praktycznie dwukrotnie szybszy.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [21]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [22]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [23]

Intel Xe2 to jednak nie tylko jednostki obliczeniowe czy obsługa Ray Tracingu, ale również wbudowane silniki związane z wyświetlaniem obrazu, częstotliwością odświeżania oraz wsparciem dla poszczególnych kodeków. Nowa architektura przynosi tutaj kilka zmian, które ponownie z racji mocnego ukierunkowania na efektywność energetyczną, mogą wpłynąć pozytywnie np. na czas pracy na zasilaniu akumulatorowym (poprzez zmniejszenie poboru mocy jednostek przy wykonywaniu konkretnych czynności). Spora w tym zasługa m.in. wsparcia dla eDisplayPort 1.5 (Lunar Lake to pierwsza seria procesorów ze wsparciem dla najnowszej wersji eDP) oraz ogólnych optymalizacji zasilania dla silnika obsługującego ekrany. Wśród podanych przykładów takich działań jest np. buforowanie w celu obniżenia apetytu na pamięć RAM, pomijanie przesyłania i wysyłania powtarzających się klatek, zablokowanie budzenia rdzeni w momencie występowania powtarzających się klatek czy kolejkowanie ramek do wyświetlacza w celu zmniejszenia częstotliwości wybudzania rdzeni ze stanu uśpienia. Optymalizacje, w zależności od wykonywanych czynności, mogą skutkować obniżeniem mocy o kilkadziesiąt do kilkuset mV (miniwat).

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [24]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [25]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [26]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [27]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [28]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [29]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [30]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [31]

Inżynierom Intela udało się również wprowadzić modyfikacje do silnika multimediów, skutkujące przede wszystkim radykalnym obniżeniem poboru mocy w zadaniach opartych na kodowaniu. Główną zmianą wpływającą na to jest dodanie dodatkowej pamięci side cache w ilości 8 MB, co umożliwia zmniejszenie ruchu w pamięci systemowej przy zadaniach opartych na wykorzystywaniu multimediów. Intel Lunar Lake oferuje zarówno kodowanie jak i dekodowanie w rozdzielczości do 8K i przy 60 Hz wraz z aktywnym HDR i przy 10-bitowej głębi barw. Obsługuje kodeki AVC, VP9, HEVC, AV1 oraz VVC (H.266), który jest najnowszym rozwiązaniem, będącym jednocześnie następcą AV1 i HEVC. Materiały wideo kodowane z użyciem VVC charakteryzują się znacznie niższym bitrate’em przy jednoczesnym zachowaniu takiej samej jakości obrazu. Umożliwia także zmniejszenie wagi plików o około 10%, umożliwia stremowanie z wykorzystaniem adaptacyjnej rozdzielczości (pozwala to na transfer mniejszej ilości danych oraz minimalizuje buforowanie streamowanych materiałów wideo) oraz obsługuje 360-stopniowe klipy. Intel w silniku multimedialnym dodaje teraz wsparcie także dla funkcji o nazwie Screen Content Coding (dla HEVC, AV1 oraz VVC), które pozwala uzyskać lepszą jakość czcionek w takich warunkach jak np. udostępnianie ekranu na innym urządzeniu, zdalne korzystanie z komputera lub streamowanie gier. W przypadku VVC warto wspomnieć, że Lunar Lake jako pierwszy obsługuje w pełni natywnie to rozwiązanie, bowiem implementacja jest na poziomie hardware, a nie software jak w przypadku Meteor Lake. Ma to istotny wpływ na pobór mocy przy oglądaniu wideo, które było zakodowane właśnie z użyciem VVC. Intel Lunar Lake w takim scenariuszu pobiera 2-3 W, podczas gdy poprzednik około 10-krotnie więcej.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [32]

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [33]

Architektura Intel Xe2 w obecnym stanie jest już w pełni kompatybilna z wieloma API i bibliotekami, a także ma już teraz bardziej dopracowane sterowniki w porównaniu do Meteor Lake czy wcześniejszych generacji. Xe2 jest w pełni zgodne m.in. z Direct3D, DirectX (w tym DirectX 12 Ultimate), Vulkan oraz Intel Video Processing Library. Na konkretniejsze wyniki wydajności musimy jednak jeszcze trochę poczekać, ale myślę że w przypadku zintegrowanych układów graficznych szykuje się prawdziwa multimedialna kobyła – dostosowana do wszelkich obecnych trendów, obsługująca wszystko co tylko powinno być obsługiwane, a także oferująca zauważalnie wyższą wydajność w grach czy w zadaniach AI. A co z kartami graficznymi Battlemage? Te na pewno się pojawią (jedno z pierwszych zdjęć w newsie prezentuje właśnie Xe2 pod postacią Lunar Lake oraz osobnego układu graficznego), ale na szczegóły musimy jeszcze poczekać… być może do wrześniowej konferencji Intel Innovation w San Jose.

Intel Xe2 - Analiza przebudowanej od podstaw architektury GPU dla układów Lunar Lake i kart graficznych Battlemage [34]

Źródło: PurePC

Oryginalne źródło: ZOBACZ
0
Udostępnij na fb
Udostępnij na twitter
Udostępnij na WhatsApp

Oryginalne źródło ZOBACZ

Subskrybuj
Powiadom o

Dodaj kanał RSS

Musisz być zalogowanym aby zaproponować nowy kanal RSS

Dodaj kanał RSS
0 komentarzy
Informacje zwrotne w treści
Wyświetl wszystkie komentarze
Poprzedni artykułNiemieccy katolicy protestują: „droga synodalna” nie reprezentuje Ludu Bożego
Następny artykułNewsletter Powiatu Tomaszowskiego: Maj 2024