A A+ A++

Najwydajniejszym układem graficznym dla graczy wciąż pozostaje NVIDIA GeForce RTX 4090. Niestety obecnie nie możemy liczyć na konkurencję od AMD w tym segmencie, choć firma odnosi sukcesy na innym polu — w dziedzinie sztucznej inteligencji. W internecie pojawił się wynik testu flagowego akceleratora graficznego AMD Instinct MI300X. Okazał się on lepszy od wspomnianego układu NVIDII, jednak nie zajął pierwszego miejsca na liście wyników benchmarku Geekbench.

Akcelerator graficzny AMD Instinct MI300X, który jest przeznaczony do zadań związanych z AI, doczekał się debiutu w benchmarku Geekbench. Jednostka od razu znalazła się na szczycie listy, ale nie wyprzedziła wszystkich układów, jakimi dysponuje konkurencyjna NVIDIA.

NVIDIA GeForce RTX 4090 pokonana w Geekbench przez układ AMD. Nie jest on jednak przeznaczony dla graczy [1]

AMD Instinct MI300X – premiera topowego akceleratora CDNA 3 dla rynku AI. Firma chwali się wydajnością względem NVIDIA H100

AMD Instinct MI300X miał swoją premierę pod koniec 2023 roku, więc na wynik pierwszego testu z benchmarku Geekbench trzeba było trochę poczekać. Ten akcelerator graficzny opiera się na architekturze CDNA 3 i został wyposażony w 192 GB pamięci HBM3. Jego bezpośrednim rywalem jest układ NVIDIA H100, którego przeznaczeniem również są centra danych. W związku z tym dla zwykłych użytkowników jednostki te są nie tylko nieprzydatne, ale poniekąd również niedostępne — AMD Instinct MI300X to koszt od 15-20 tys. dolarów, natomiast wspomniana NVIDIA H100 (PCIe) to już wydatek rzędu 30-40 tys. dolarów.

  NVIDIA H100 PCIe AMD Instinct MI250 AMD Instinct MI250X AMD Instinct MI300X
Architektura Hopper CDNA 2 CDNA 2 CDNA 3
Budowa Monolit MCM MCM MCM
Litografia TSMC 4 nm TSMC 6 nm TSMC 6 nm TSMC 5 nm
TSMC 6 nm FinFET
Tranzystory 80 mld 58,2 mld 58,2 mld 153 mld
Bloki CU/SM 114 208 220 304
Procesory 14592 13312 14080 19456
Rdzenie Matrix 832 880 ?
Rdzenie Tensor 456 (4 per SM)
Taktowanie Boost Brak informacji 1700 MHz 1700 MHz 2100 MHz
Moc FP32 48,0 TFLOPS 45,3 TFLOPS 47,9 TFLOPS 163,4 TFLOPS
Moc FP32 Matrix 90,5 TFLOPS 95,7 TFLOPS 163,4 TFLOPS
Moc FP64 24,0 TFLOPS 45,3 TFLOPS 47,9 TFLOPS 81,7 TFLOPS
Moc FP64 Matrix 90,5 TFLOPS 95,7 TFLOPS 163,4 TFLOPS
Pamięć 80 GB HBM3 128 GB HBM2e 128 GB HBM2e 192 GB HBM3
Magistrala 5120-bit 8192-bit 8192-bit 8192-bit
Przepustowość 2 TB/s 3,2 TB/s 3,2 TB/s 5,2 TB/s
Pobór mocy 350 W 560 W 560 W 750 W

Linux vs Windows – Który system jest lepszy do gier? Test wydajności z udziałem NVIDIA GeForce RTX 4090 i GTX 1660 Ti

Przechodząc już do samych wyników z benchmarku Geekbench 6.3.0, w którym mierzona była wydajność układu graficznego z wykorzystaniem bibliotek OpenCL: tytułowy akcelerator graficzny osiągnął w tym teście wartość 379 660 pkt, czym udało mu się prześcignąć układ NVIDIA GeForce RTX 4090 o 6 340 pkt (warto zauważyć, że pobór mocy znacząco się różni pomiędzy tymi jednostkami). Wyżej zaskakująco uplasował się układ graficzny przeznaczony do stacji roboczych, a mianowicie NVIDIA RTX 6000 Ada, gdyż zakończył test z wynikiem 387 053 pkt. W czwartym kwartale 2024 roku na rynku pojawi się kolejny układ od AMD z rodziny Instinct (MI325X), który także zostanie oparty na architekturze CDNA 3, jednak zaoferuje aż 288 GB pamięci HBM3e – w tym wypadku celem jest konkurowanie z układem NVIDIA H200. Kolejne granice w benchmarku Geekbench szybko zostaną więc przekroczone, choć oczywiście nie do tego zostały stworzone omawiane jednostki.

  Geekbench 6.3.0 (OpenCL Score)
NVIDIA RTX 6000 Ada 387 053 pkt
AMD Instinct MI300X 379 660 pkt
NVIDIA GeForce RTX 4090 373 320 pkt
NVIDIA L40S 368 917 pkt
NVIDIA H100 337 925 pkt
NVIDIA GeForce RTX 4080 288 340 pkt
NVIDIA GeForce RTX 4070 SUPER 243 937 pkt
AMD Radeon RX 7900 XTX 229 131 pkt
  NVIDIA GeForce RTX 6000 ADA NVIDIA GeForce RTX 4090
Architektura Ada Lovelace Ada Lovelace
Układ graficzny AD102 AD102
CUDA 18 176 16 384
Wydajność RT 210,6 TFLOPS 191 TFLOPS
Wydajność  Tensor 1457 TFLOPS 1321 TFLOPS
Jednostki RT 142 128
Jednostki Tensor 568 512
Ilość pamięci 48 GB 24 GB
Typ pamięci GDDR6 GDDR6X
Szyna pamięci 384-bit 384-bit
Przepustowość 960 GB/s 1000 GB/s
Interfejs PCI-E 4.0 x16 PCI-E 4.0 x16
Współczynnik TGP 300 W 450 W

NVIDIA GeForce RTX 4090 pokonana w Geekbench przez układ AMD. Nie jest on jednak przeznaczony dla graczy [2]

Źródło: Geekbench

Oryginalne źródło: ZOBACZ
0
Udostępnij na fb
Udostępnij na twitter
Udostępnij na WhatsApp

Oryginalne źródło ZOBACZ

Subskrybuj
Powiadom o

Dodaj kanał RSS

Musisz być zalogowanym aby zaproponować nowy kanal RSS

Dodaj kanał RSS
0 komentarzy
Informacje zwrotne w treści
Wyświetl wszystkie komentarze
Poprzedni artykułNBA: Embiid nie docenia sukcesu Celtics
Następny artykułTwoje Fajne Miasto. Gościliśmy w Suwałkach