A A+ A++

O układzie NVIDIA Grace, pierwszym procesorze opartym na architekturze ARM dla rynku HPC, producent informował jeszcze w 2021 roku. Sporo szczegółów na temat specyfikacji oraz budowy poznaliśmy podczas tegorocznej konferencji GPU Technology Conference 2022 (GTC 2022), kiedy to ogłoszono również najnowszy akcelerator NVIDIA H100 (Hopper). Teraz, podczas Hot Chips 34, ujawniono nowe szczegóły związane ze specyfikacją zarówno bazowego układu Grace jak również sklejek NVIDIA Grace CPU Superchip oraz NVIDIA Grace Hopper Superchip.

Podczas konferencji Hot Chips 34 firma NVIDIA ujawniła kolejne szczegóły dotyczące specyfikacji układu Grace, przygotowanego z myślą o rynku HPC.

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [1]
NVIDIA Grace Hopper Superchip – połączenie układu NVIDIA Grace oraz akceleratora H100

Premiera akceleratora NVIDIA H100 Hopper – Litografia TSMC 4 nm, 80 GB pamięci HBM3 i TDP do 700 W

NVIDIA już od dawna daje jasno do zrozumienia, że ma aspiracje do wejścia na rynek procesorów. Te plany mają zostać zrealizowane na rynku HPC wraz z premierą układu Grace, który oparto na architekturze ARM v9. Podstawowy chip Grace posiada 72 rdzenie ARM v9.0, wspomaganymi dodatkowo przez instrukcje SVE2 oraz instrukcje dla wirtualizacji: Nested Virtualization oraz S-EL2. Układ będzie wyprodukowany w niestandardowym procesie TSMC “4N”, będącym po prostu ulepszoną wersją podstawowego TSMC N5. NVIDIA Grace została zaprojektowana do pracy w parach i z tego powodu jedną z kluczowych technologii zaimplementowanych w układzie jest mostek NVLink C2C (C2C – Chip-to-chip), który umożliwia połączenie jednego procesora Grace z jednym akceleratorem NVIDIA H100 (tzw. NVIDIA Grace Hopper Superchip) lub dwóch procesorów Grace (tzw. NVIDIA Grace CPU Superchip). Zastosowanie w tym celu autorskiej techniki NVLink ma wyeliminować wąskie gardło, jakie mogłoby się pojawić w momencie łączenia dwóch różnych układów (tzw. cross-socket). Połączenie NVLink C2C oferuje także czystą, dwukierunkową przepustowość rzędu 900 GB/s, przy jednocześnie 5-krotnie niższym zużyciu energii interfejsu w porównaniu do magistrali PCIe.

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [2]
NVIDIA Grace CPU Superchip – sklejka z dwóch układów NVIDIA Grace z łącznie 144 rdzeniami ARM v9

Biren BR100 – nowe informacje o specyfikacji oraz wydajności chińskiego akceleratora wprost z konferencji Hot Chips 34

NVIDIA zdradziła także szczegóły dotyczące wykorzystanej pamięci oraz jej przepustowości. Układ Grace skorzysta z maksymalnie 512 GB pamięci RAM typu LPDDR5X (łącznie 32 kanały), dodatkowo z aktywną korekcją błędów. Przepustowość takiej konfiguracji pamięci sięga 546 GB/s. Producent ujawnił również, że wykorzystanie pamięci typu LPDDR5X związane jest z najlepszym stosunkiem (w porównaniu do HBM oraz DDR5) kosztu, przepustowości oraz ogólnego zapotrzebowania na energię do uzyskiwanej wydajności. NVIDIA Grace obsługuje także magistralę PCIe 5.0 – do dyspozycji oddano 68 linii w nowym standardzie. Gdy spojrzymy na połączone dwa chipy Grace CPU (czyli wspomniany wyżej Grace CPU Superchip), okazuje się, że tak zbudowany układ oferuje 144 rdzenie ARM v9.0 oraz do 1 TB pamięci LPDDR5X o przepustowości nieco ponad 1 TB/s. TDP tak zbudowanego “superchipa” wynosi 500 W.

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [3]

Intel Ponte Vecchio pokazany na Hot Chips 34 – wydajność akceleratora ma być nawet 2,5x większa od NVIDIA A100

Jeśli chodzi o wydajności NVIDIA Grace CPU oraz Grace CPU Superchip, to producent podczas konferencji Hot Chips 34 posłużył się benchmarkiem SpecIntRate2k17. Pojedynczy układ Grace z 72 rdzeniami oferuje wynik na poziomie 370 punktów, z kolei Grace CPU Superchip już 740 punktów – to rezultat wyższy od dwóch połączonych procesorów AMD EPYC 7742 (128 rdzeni Zen 2 – 667 pkt), ale jednocześnie mniej od sklejki składającej się z dwóch układów AMD EPYC 7763 (128 rdzeni Zen 3 – 861 pkt). Wynik naprawdę dobry, tym bardziej że architektura nie jest oparta na x86 a na ARM. NVIDIA Grace CPU Superchip promowany będzie jako rozwiązanie z myślą o infrastrukturze HPC oraz prostych obliczeniach AI. Z kolei NVIDIA Grace Hopper Superchip, ze względu na obecność akceleratora H100, będzie przygotowany przede wszystkim  z myślą o bardzo rozbudowanych obliczeniach opartych na sztucznej inteligencji. NVIDIA Grace obecnie nadal jest w fazie opracowywania, a jego premiera spodziewana jest w pierwszej połowie 2023.

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [4]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [5]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [6]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [7]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [8]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [9]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [10]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [11]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [12]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [13]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [14]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [15]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [16]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [17]

NVIDIA Grace z kolejnymi szczegółami - układ zaoferuje 72 rdzenie ARM v9, obsługę do 512 GB LPDDR5X oraz TDP do 500 W [18]

Źródło: WCCFTech

Oryginalne źródło: ZOBACZ
0
Udostępnij na fb
Udostępnij na twitter
Udostępnij na WhatsApp

Oryginalne źródło ZOBACZ

Subskrybuj
Powiadom o

Dodaj kanał RSS

Musisz być zalogowanym aby zaproponować nowy kanal RSS

Dodaj kanał RSS
0 komentarzy
Informacje zwrotne w treści
Wyświetl wszystkie komentarze
Poprzedni artykułTomasz Swędrowski przed mistrzostwami świata: Z grupy wyjdziemy na pewno
Następny artykułOstatnie chwile, aby obejrzeć w Płocku wystawę prac jednego z najwybitniejszych polskich grafików i ilustratorów