Najwydajniejszym układem graficznym dla graczy wciąż pozostaje NVIDIA GeForce RTX 4090. Niestety obecnie nie możemy liczyć na konkurencję od AMD w tym segmencie, choć firma odnosi sukcesy na innym polu — w dziedzinie sztucznej inteligencji. W internecie pojawił się wynik testu flagowego akceleratora graficznego AMD Instinct MI300X. Okazał się on lepszy od wspomnianego układu NVIDII, jednak nie zajął pierwszego miejsca na liście wyników benchmarku Geekbench.
Akcelerator graficzny AMD Instinct MI300X, który jest przeznaczony do zadań związanych z AI, doczekał się debiutu w benchmarku Geekbench. Jednostka od razu znalazła się na szczycie listy, ale nie wyprzedziła wszystkich układów, jakimi dysponuje konkurencyjna NVIDIA.
AMD Instinct MI300X – premiera topowego akceleratora CDNA 3 dla rynku AI. Firma chwali się wydajnością względem NVIDIA H100
AMD Instinct MI300X miał swoją premierę pod koniec 2023 roku, więc na wynik pierwszego testu z benchmarku Geekbench trzeba było trochę poczekać. Ten akcelerator graficzny opiera się na architekturze CDNA 3 i został wyposażony w 192 GB pamięci HBM3. Jego bezpośrednim rywalem jest układ NVIDIA H100, którego przeznaczeniem również są centra danych. W związku z tym dla zwykłych użytkowników jednostki te są nie tylko nieprzydatne, ale poniekąd również niedostępne — AMD Instinct MI300X to koszt od 15-20 tys. dolarów, natomiast wspomniana NVIDIA H100 (PCIe) to już wydatek rzędu 30-40 tys. dolarów.
NVIDIA H100 PCIe | AMD Instinct MI250 | AMD Instinct MI250X | AMD Instinct MI300X | |
Architektura | Hopper | CDNA 2 | CDNA 2 | CDNA 3 |
Budowa | Monolit | MCM | MCM | MCM |
Litografia | TSMC 4 nm | TSMC 6 nm | TSMC 6 nm | TSMC 5 nm TSMC 6 nm FinFET |
Tranzystory | 80 mld | 58,2 mld | 58,2 mld | 153 mld |
Bloki CU/SM | 114 | 208 | 220 | 304 |
Procesory | 14592 | 13312 | 14080 | 19456 |
Rdzenie Matrix | – | 832 | 880 | ? |
Rdzenie Tensor | 456 (4 per SM) | – | – | – |
Taktowanie Boost | Brak informacji | 1700 MHz | 1700 MHz | 2100 MHz |
Moc FP32 | 48,0 TFLOPS | 45,3 TFLOPS | 47,9 TFLOPS | 163,4 TFLOPS |
Moc FP32 Matrix | – | 90,5 TFLOPS | 95,7 TFLOPS | 163,4 TFLOPS |
Moc FP64 | 24,0 TFLOPS | 45,3 TFLOPS | 47,9 TFLOPS | 81,7 TFLOPS |
Moc FP64 Matrix | – | 90,5 TFLOPS | 95,7 TFLOPS | 163,4 TFLOPS |
Pamięć | 80 GB HBM3 | 128 GB HBM2e | 128 GB HBM2e | 192 GB HBM3 |
Magistrala | 5120-bit | 8192-bit | 8192-bit | 8192-bit |
Przepustowość | 2 TB/s | 3,2 TB/s | 3,2 TB/s | 5,2 TB/s |
Pobór mocy | 350 W | 560 W | 560 W | 750 W |
Linux vs Windows – Który system jest lepszy do gier? Test wydajności z udziałem NVIDIA GeForce RTX 4090 i GTX 1660 Ti
Przechodząc już do samych wyników z benchmarku Geekbench 6.3.0, w którym mierzona była wydajność układu graficznego z wykorzystaniem bibliotek OpenCL: tytułowy akcelerator graficzny osiągnął w tym teście wartość 379 660 pkt, czym udało mu się prześcignąć układ NVIDIA GeForce RTX 4090 o 6 340 pkt (warto zauważyć, że pobór mocy znacząco się różni pomiędzy tymi jednostkami). Wyżej zaskakująco uplasował się układ graficzny przeznaczony do stacji roboczych, a mianowicie NVIDIA RTX 6000 Ada, gdyż zakończył test z wynikiem 387 053 pkt. W czwartym kwartale 2024 roku na rynku pojawi się kolejny układ od AMD z rodziny Instinct (MI325X), który także zostanie oparty na architekturze CDNA 3, jednak zaoferuje aż 288 GB pamięci HBM3e – w tym wypadku celem jest konkurowanie z układem NVIDIA H200. Kolejne granice w benchmarku Geekbench szybko zostaną więc przekroczone, choć oczywiście nie do tego zostały stworzone omawiane jednostki.
Geekbench 6.3.0 (OpenCL Score) | |
NVIDIA RTX 6000 Ada | 387 053 pkt |
AMD Instinct MI300X | 379 660 pkt |
NVIDIA GeForce RTX 4090 | 373 320 pkt |
NVIDIA L40S | 368 917 pkt |
NVIDIA H100 | 337 925 pkt |
NVIDIA GeForce RTX 4080 | 288 340 pkt |
NVIDIA GeForce RTX 4070 SUPER | 243 937 pkt |
AMD Radeon RX 7900 XTX | 229 131 pkt |
NVIDIA GeForce RTX 6000 ADA | NVIDIA GeForce RTX 4090 | |
Architektura | Ada Lovelace | Ada Lovelace |
Układ graficzny | AD102 | AD102 |
CUDA | 18 176 | 16 384 |
Wydajność RT | 210,6 TFLOPS | 191 TFLOPS |
Wydajność Tensor | 1457 TFLOPS | 1321 TFLOPS |
Jednostki RT | 142 | 128 |
Jednostki Tensor | 568 | 512 |
Ilość pamięci | 48 GB | 24 GB |
Typ pamięci | GDDR6 | GDDR6X |
Szyna pamięci | 384-bit | 384-bit |
Przepustowość | 960 GB/s | 1000 GB/s |
Interfejs | PCI-E 4.0 x16 | PCI-E 4.0 x16 |
Współczynnik TGP | 300 W | 450 W |
Źródło: Geekbench
Zgłoś naruszenie/Błąd
Oryginalne źródło ZOBACZ
Dodaj kanał RSS
Musisz być zalogowanym aby zaproponować nowy kanal RSS