Od wielu miesięcy pojawiały się doniesienia, że AMD wraz z nową generacją akceleratorów graficznych chce zaprezentować układ MCM, a więc zbudowany na bazie więcej niż jednej jednostki obliczeniowej. Podobne rozwiązanie wprowadzono już z powodzeniem w procesorach Ryzen (konsumenckie, HEDT Threadripper oraz serwerowe EPYC), przyszła w końcu pora by pokazać możliwości MCM także na rynku GPU. Podczas dzisiejszej konferencji AMD Accelerated Data Center Premiere, producent pokazał flagowy akcelerator oparty na architekturze CDNA 2 – Instinct MI250X. Dodatkowo, rynek HPC wzbogacił się o serwerowe procesory EPYC Milan-X. Choć bazują na architekturze Zen 3, oferują technologię o nazwie 3D V-Cache, która za kilka miesięcy zostanie wprowadzona także do konsumenckich Ryzenów.
Podczas dzisiejszej konferencji Accelerated Data Center Premiere, firma AMD oficjalnie zaprezentowała akcelerator graficzny Instinct MI250X, który jako pierwszy w ofercie AMD wykorzystuje modułową budowę MCM. Oprócz tego pokazano serwerowe procesory EPYC Milan-X z pamięcią 3D V-Cache. Ponadto AMD potwierdziło informacje na temat serwerowych układów EPYC Genoa oraz EPYC Bergamo. Pojawią się odpowiednio w 2022 oraz 2023 roku.
AMD EPYC Milan-X oraz Instinct MI250X – już za kilka dni prezentacja firmy dotycząca najnowszych rozwiązań dla rynku HPC
Podczas dzisiejszej prezentacji AMD pokazało możliwości nowego akceleratora graficznego Instinct MI250X. Oprócz niego pojawi się także Instinct MI250 – oba warianty CDNA 2 będą oferowane w zabudowanej wersji OAM widocznej na zdjęciach. Ponadto wkrótce w ofercie producenta pojawi się także Instinct MI210 w wersji PCIe, jednak tutaj nie podzielono się konkretną specyfikacją. Tak jak przypuszczaliśmy od dawna, nowe akceleratory wykorzystują budowę typu MCM z dwoma oddzielnymi blokami obliczeniowymi. W topowej wersji CDNA 2, każdy z tych jednostek obliczeniowych posiada 110 bloków Compute Units. Tym samym cały Instinct MI250X posiada ich aż 220. Dla porównania Instinct MI250 jest tylko nieco przyciętą wersją CDNA 2 ze 104 blokami CU na każdy rdzeń obliczeniowy (łącznie 208 CU). Oba układy wyposażone są także w 128 GB pamięci HBM2e o przepustowości 3.2 TB/s. Co ciekawe, nowe akceleratory korzystają z 6 nm procesu technologicznego TSMC. Wcześniej sugerowano raczej ponowne wykorzystanie 7 nm, ale ta informacja finalnie nie potwierdziła się.
AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI100 | NVIDIA A100 | |
Architektura | CDNA 2 | CDNA 2 | CDNA | Ampere |
Budowa | MCM | MCM | Monolit | Monolit |
Bloki obliczeniowe | 2x 110 CU (220 CU) | 2x 104 CU (208 CU) | 120 CU | 108 SM |
Rdzenie Matrix | 2x 440 (880) | 2x 416 (832) | 480 | – |
Proces technologiczny | 6 nm TSMC | 6 nm TSMC | 7 nm TSMC | 7 nm TSMC |
Tranzystory | 2x 29.1 mld (łącznie 58.2 mld) | 2x 29.1 mld (łącznie 58.2 mld) | 25.6 mld | 54.2 mld |
Taktowanie Boost | 1700 MHz | 1700 MHz | 1502 MHz | 1410 MHz |
Wydajność FP32 | 47.9 TFLOPS | 45.3 TFLOPS | 23.1 TFLOPS | 19.5 TFLOPS |
Wydajność FP32 (Matrix) | 95.7 TFLOPS | 90.5 TFLOPS | 46.1 TFLOPS | – |
Wydajność FP64 | 47.9 TFLOPS | 45.3 TFLOPS | 11.5 TFLOPS | 9.7 TFLOPS |
Wydajność FP64 (Matrix) | 95.7 TFLOPS | 90.5 TFLOPS | 11.5 TFLOPS | – |
Pamięć | 128 GB HBM2e | 128 GB HBM2e | 32 GB HBM2 | 40 GB HBM2e |
Taktowanie VRAM | 3.2 Gbps HBM2e | 3.2 Gbps HBM2e | 2.4 Gbps HBM2 | 3.2 Gbps HBM2e |
Magistrala pamięci | 8192-bit | 8192-bit | 4096-bit | 5120-bit |
Przepustowość | 3.2 TB/s | 3.2 TB/s | 1.23 TB/s | 1.6 TB/s |
TDP | 560 W | 560 W | 300 W | 400 W |
AMD EPYC Milan-X – producent szykuje 64-rdzeniowe, serwerowe procesory 3D V-Cache z imponującą ilością cache L3
Imponująco prezentuje się wektorowa wydajność FP32 oraz FP64 dla nowych akceleratorów graficznych CDNA 2. Dla taktowania w trybie Boost sięgającego 1700 MHz, moc obliczeniowa FP32 oraz FP64 wynosi równe 47.9 TFLOPS dla Instinct MI250X oraz 45.3 TFLOPS dla Instinct MI250. Dla porównania wektorowa wydajność FP64 dla akceleratora NVIDIA A100 (Ampere) wynosi 9.7 TFLOPS, z kolei dla Instinct MI100 (architektura CDNA) – 11.5 TFLOPS. Nowe układy, podobnie jak pierwsza odsłona CDNA, posiada także odrębne jednostki Matrix służące do wyspecjalizowanych obliczeń. Wykorzystując rdzenie Matrix, wydajność FP32 oraz FP64 niemalże się podwaja, osiągając wartości 95.7 TFLOPS dla Instinct MI250X oraz 90.8 TFLOPS dla Instinct MI250. Odpowiednikiem u NVIDII tychże rdzeni są Tensory i w scenariuszu ich wykorzystania, moc obliczeniowa FP64 sięga 19.5 TFLOPS. Bez wątpienia nowe akceleratory AMD będą bardzo wydajnymi konstrukcjami, jeśli przyjdzie je wykorzystać w obliczeniach pojedynczej oraz podwójnej precyzji.
AMD chce w procesorach rozwijać technologię układania stosów 3D. Pierwszym podejściem będą Ryzeny posiadające 3D V-Cache
Jedną z różnic pomiędzy obydwoma zaprezentowanymi akceleratorami jest liczba dostępnych złączy Infinity Fabric. Flagowy Instinct MI250X posiada 8 takich złączy, podczas gdy Instinct MI250 posiada 6 złączy Infinity Fabric. Wracając jeszcze na moment do tematu pamięci VRAM. Jak już wspomniałem, oba układy wykorzystują pamięć HBM2e. Na każdą matrycę obliczeniową przewidziano cztery stosy HBM2e o przepustowości ok. 1.64 TB/s na każdą matrycę. Przebudowana architektura i wykorzystanie budowy MCM spowodowało także zauważalny wzrost współczynnika TDP w porównaniu do Instinct MI100. Wynosi on 560 W dla obydwu akceleratorów, ale jesteśmy bardziej niż pewni, że przełoży się to na imponujący wzrost wydajności. Tym bardziej, że już na początku 2022 roku nowe układy AMD Instinct serii MI200 wylądują w wyczekiwanym superkomputerze Frontier, bazującym także na serwerowych procesorach AMD EPYC Milan-X. Frontier znajdzie swoje miejsce w placówce OAK Ridge National Laboratory w stanie Tennessee (USA).
AMD świętuje 5 urodziny architektury Zen i potwierdza debiut procesorów Ryzen z 3D V-Cache w 2022 roku
Skoro już wspomnieliśmy o procesorach AMD EPYC Milan-X, to pora przejść do drugiej części dzisiejszej zapowiedzi. Firma w końcu potwierdziła wprowadzenie technologii 3D V-Cache do serwerowych jednostek. AMD chwali się, że wraz z użyciem stosów z dodatkową pamięcią cache L3, odświeżone układy EPYC Milan-X będą dysponować maksymalnie 768 MB L3 (do 804 MB całkowitej pamięci cache na socket). Wśród odświeżonych procesorów, znajdziemy łącznie cztery układy: AMD EPYC 7373X, EPYC 7473X, EPYC 7573X oraz EPYC 7773X. Choć dzisiaj ujawniono próbkę możliwości EPYC Milan-X oraz ich specyfikację, właściwy debiut odbędzie się w pierwszym kwartale 2022 roku. Z pewnością wtedy pojawią się także odświeżone Ryzeny (Zen 3) z pamięcią 3D V-Cache.
Układ | EPYC 7373X | EPYC 7473X | EPYC 7573X | EPYC 7773X |
Architektura | Zen 3 | Zen 3 | Zen 3 | Zen 3 |
Litografia | 7 nm TSMC | 7 nm TSMC | 7 nm TSMC | 7 nm TSMC |
Rdzenie/wątki | 16C/32T | 24C/48T | 32C/64T | 64C/128T |
Zegar bazowy | 3,05 GHz | 2,8 GHz | 2,8 GHz | 2,2 GHz |
Zegar Turbo | 3,8 GHz | 3,7 GHz | 3,6 GHz | 3,5 GHz |
Cache L3 | 768 MB | 768 MB | 768 MB | 768 MB |
TDP | 240 W | 240 W | 280 W | 280 W |
AMD Zen 4 Dense (Zen 4D) ma być odpowiedzią firmy na technologię Intel Hybrid, zastosowaną w procesorach Alder Lake
Na końcu firma AMD ujawniła pierwsze informacje na temat nadchodzących generacji serwerowych procesorów EPYC. Producent potwierdził prace nad układami EPYC Genoa, które będą wykorzystywały architekturę Zen 4 oraz 5 nm proces technologiczny TSMC. Potwierdzono, że pierwsze próbki procesorów są już rozsyłane do klientów, z kolei masowa produkcja oraz premiera nastąpi w 2022 roku. EPYC Genoa zostanie wyposażony w maksymalnie 96 rdzeni oraz będzie wspierał interfejs PCIe 5.0 – obie te informacje zostały finalnie potwierdzone przez firmę. Co ciekawe, AMD ujawniło także pierwsze szczegóły dotyczące rodziny EPYC Bergamo. Pisaliśmy o nich raptem kilka dni temu, gdy ujawniono, że mają wykorzystać nieco zmodyfikowaną architekturę Zen 4, nastawioną bardziej na energooszczędność. Finalnie okazało się, że AMD faktycznie ma takie plany, aczkolwiek architektura nie zostanie nazwana Zen 4D, a Zen 4c. Literka “c” oznacza, że procesory te zostaną przygotowane z myślą o aplikacjach cloud. EPYC Bergamo ma odznaczać się wysoką efektywnością energetyczną, co niejako potwierdza modyfikację architektury w celu zmniejszenia poboru energii. Tym samym jest duże prawdopodobieństwo, że te same (lub w nieco zmienionej formie) rdzenie będą częścią swoistego big.LITTLE przygotowywanego przez AMD. Układy te będą także kompatybilne z podstawką przygotowaną dla głównej linii EPYC Genoa i podobnie jak one, wykorzystają 5 nm litografię TSMC. Podczas prezentacji Lisa Su potwierdziła, iż EPYC Bergamo będzie wyposażony w 128 rdzeni, a ich debiut nastąpi w pierwszej połowie 2023.
Źródło: AMD
Zgłoś naruszenie/Błąd
Oryginalne źródło ZOBACZ
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS