AMD, işlemci alanındaki mühendislik başarını Radeon ekran kartlarına taşımayı başarmış durumda. Bir müddet evvel tanıtılan Radeon RX 7000 serisinin zirve modelleri RX 7900 XTX ve RX 7900 XT, firmanın en gelişmiş RDNA 3 tabanlı Navi 31 GPU’sunu kullanıyor. Dünyanın birinci chiplet dizaynlı grafik işlemcisi olan Navi 31’in ortaya çıkan diyagram şeması ise tüm ayrıntıları açığa çıkarıyor.
AMD, Ryzen ve EPYC işlemcileriyle birlikte chiplet ihtilalinin öncüsü olmuştu. Bu sayede daha düşük maliyet ve güç tüketiminde daha yüksek performans elde etmeyi başarmıştı. AMD’nin chiplet yani yongalardan oluşan GPU tasarımı standart monolitik dizayna karşı yıkıcı bir mimari yaklaşım sunuyor.
Navi 31 diyagramı ortaya çıktı
Bu bağlamda duyurulan kartlarda kullanılan Navi 31 GPU’sunun ortaya çıkan blok şeması bizlere tanıtımda görmediğimiz ayrıntıları ve bilgileri gösteriyor. Birinci olarak yüzeysel başlayalım. AMD, Navi 31 GPU’sunda bir grafik süreç zarı (Graphics Compute Die – GCD) ve altı bellek zarına (Memory Cache Dies – MCD) yer veriyor.
Grafik zarının dışındaki kalıplar, her biri büyükçe L3 önbelleğiyle birleştirilmiş 32 bit denetleyicileri barındırıyor. Bu modüller TSMC’nin 6nm süreç sürecinde imal ediliyor. Merkezde yer alan ana grafik kalıbı ise TSMC 5nm süreciyle üretiliyor.
Ek olarak RDNA 3 mimarili Navi 31 GPU’su toplamda 58 milyar transistör içeriyor ve 61 TFLOP teorik hesaplama performansı vadediyor. Aktarılanlara nazaran Navi 31 GPU’su, RDNA 2 üstünde şekillenen Navi 21’e oranla mm2 başına yüzde 165 daha fazla transistör barındırıyor. AMD, watt başına performansın yüzde 54, kuşaktan kuşağa güzelleşmenin ise yüzde 45 olduğunu belirtiyor.
Hemen üstte yer alan sızdırılan diyagram ise bizlere her biri 8 çift Hesaplama Ünitesi (CU) ile paketlenmiş 6 Shader Engine sistemini gösteriyor. Münasebetiyle kolay bir hesapla Navi31 GPU’sunda toplamda 96 CU yahut 48 WGP (Workgroup Processor) yer aldığını öğreniyoruz. Tekrar küçük bir hesaplama ile her bir CU’da 64 Shader Units yer aldığını fark ediyoruz, daha evvelce bu sayı 128 SU olarak kestirim ediliyordu.
Çekirdek sayısındaki baş karışıklığı neyden kaynaklanıyor?
Şimdi işin enteresan noktasına gelelim. Şayet AMD’nin yahut ortaklarının sitesine giderseniz RX 7900 XTX’te yani münasebetiyle da Navi 31’de toplam 6144 SP (Stream Processor) yani Stream İşlemcisi yer aldığını görürsünüz. Ancak neredeyse tüm medya bu sayısı 12288 adet olarak belirtiyor. Peki bu dev fark neyden kaynaklanıyor?
AMD, RDNA 3 mimarisiyle öbür bir mühendislik başarısına daha imza atmış durumda. Firma, dizaynına çift çıkışlı SIMD ekleyerek işlem randımanını iki katına çıkarmış lakin çekirdek sayısını ise ikiye katlamamış durumda. Bu nedenle Navi 31’de 6144 SP yer alıyor ve temelinde pratikte 12288 SP olarak çalışıyor. İkili süreç yürütme tekniği, fizikî olarak iki kat daha fazla çekirdek kadar performans gösteremez ancak sanılandan çok daha düşük çekirdek sayısıyla bu kadar performans elde edilmesinin altında yatan da bu tekniktir diyebiliriz.
Olayı biraz açarsak, çift SIMD sayesinde RDNA 3 mimarisi birebir anda bir yerine iki FP32 sürecini yürüyebiliyor. Bunun manası, her bir CU ünitesinin artık 64 (RDNA2) yerine 128 FP32 hesaplaması yapabilecek olması.
Ön bellek hiyerarşisi
Önbellek sistemine gelince, AMD’nin RDNA 3 Navi 31 GPU’su bizleri toplam 4 farklı bellek hiyerarşisiyle karşıladığını görüyoruz. Bunlardan birinci, 5,2 TB/s genişliğindeki Infinity Fabric bağlantısına sahip 6 MCD havuzunda yer alan 96 MB L3 Infinity Cache. Evvelki jenerasyona oranla yüzde 50 artan 6 MB L2, evvelki jenerasyona oranla yüzde 300 artan 3 MB L1 ve evvelki jenerasyona oranla yüzde 240 artan 3 MB L0 önbelleklere sahibiz.
AMD’ye nazaran GPU için efektif faal bant genişliği 3,5 TB/s. Hasebiyle, Infinity Cache‘in yaklaşık 2,5 TB/sn bant genişliği sunduğu ve geri kalan 960 GB/sn bant genişliğinin GDDR6 belleklerden geldiğini görüyoruz.
Diğer detaylar
Bunlarla birlikte AMD, yeni mimaride ikinci kuşak ışın izleme teknolojisine geçiş yaparak CU başına yüzde 50 daha faza performans sunan RT hızlandırıcıları kullanıyor. Yüksek önbellek ölçüsü ve artan bant genişliği ışın izleme üzere GPU’nun süratlice erişmek istediği süreçlerde önemli performans kazanımı vadediyor.
RDNA 3 mimarisi düşünülenden daha verimli
AMD’nin yeni Navi 31 GPU’su üstte da belirttiğimiz üzere 12.288 yerine 6144 SP çekirdeğine sahip. Evvelki jenerasyonda yani Navi 21 tabanlı Radeon RX 6950 XT’de bu rakamın 5120 SP olduğunu biliyoruz. Sonuç olarak, jenerasyondan kuşağa artış yalnızca yüzde 20, yani bahsedildiği üzere 2.4 kat değil.
?️ | RX 7900 XTX | RX 6950 XT |
Stream İşlemci | 96 CU (6144) | 80 CU (5120) |
ROP | 192 | 128 |
Oyun Frekans | 2.3 GHz | 2100 MHz |
Boost Frekans | 2.5 GHz | 2310 MHz |
FP32 | 61 TFLOPs | 21.5 TFLOPs |
Bellek Hızı | 20 Gbps GDDR6 | 18 Gbps GDDR6 |
Bellek Veriyolu | 384-bit | 256-bit |
Bellek | 24GB | 16GB |
Infinity Cache | 96MB | 128MB |
TBP | 355W | 335W |
Üretim Tekniği |
GCD: TSMC 5nm MCD: TSMC 6nm |
TSMC 7nm |
Transistör | 58 milyar | 26.8 milyar |
Mimari | RDNA 3 | RDNA 2 |
GPU | Navi 31 | Navi 21 |
Fiyat | 999 dolar | 1099 dolar |
Fakat buna karşın AMD, RX 7900 XTX’in (355W) RX 6950 XT’den (335W) 4K’da 1,7 kat, genel olarak ise yüzde 70 daha hızlı. Bunun bir işareti olan öteki bir ayrıntı ise evvelki jenerasyonda olan 21 TFLOP düzeyindeki teorik güç bu jenerasyonda yüzde 165 artarak 61 TFLOP düzeyine çıkarılmış. Üstelik bunu sadece 20W artış ile vadediyor.
Yazımızın sonuna gelirken, AMD’nin chiplet dizaynıyla birleştirdiği yeni RDNA 3 mimarisinin ve sonucunda ortaya koymuş olduğu Navi 31 grafik işlemcisinin heyecan verici olduğunu belirtebiliriz. Her ne kadar AMD, performans manasında bu jenerasyonda de Nvidia’nın RTX 4090 kartını yakalayamamış olsa da verimlilik alanında öne geçmeyi başarmış durumda. Son olarak, RX 7900 XTX ve RX 7900 XT kartları 13 Aralık tarihinde sırasıyla 999 dolar ve 899 dolar fiyat etiketiyle satışa çıkacak.