IBM’in Yeni System Z CPU’su, Soket Başına Yüzde 40 Daha Fazla Performans, Entegre Yapay Zeka – ExtremeTech

IBM, Hot Chips’te yaklaşmakta olan Telum CPU’su hakkında yeni ayrıntılar paylaştı ve yeni mikro mimari, eski z15’e göre önemli bir ilerleme gibi görünüyor. Bu, IBM’in Samsung’un EUV’sini kullanarak oluşturulan ilk 7nm CPU’su olacak ve Samsung için EUV özelliklerini gösterme açısından ileriye doğru atılmış büyük bir adım olacak.

IBM’nin Telum’u bir anabilgisayar CPU’su, yani çok farklı bir bilgi işlem ortamında çalıştığı anlamına geliyor. bir x86 çipinden daha fazla. Hem ana bilgisayar hem de sunucu, yakındaki büyük bir DRAM havuzuna, çeşitli bağlı depolama biçimlerine ve çok sayıda CPU çekirdeğine sahip entegre bir platformdur, ancak ana bilgisayarlar, tipik x86 sunucunuzdan çok farklı amaçlar için tasarlanmıştır.

Mainframe’ler, sistem verimini ve güvenilirliğini x86 sunucularının erişemeyeceği bir dereceye kadar en üst düzeye çıkarmak için tasarlanmıştır. Geleneksel bir x86 sistemi, hızlandırıcılardan mümkün olduğunca fazla işlemciye ve CPU veya GPU’ya taşındığında, ana bilgisayarlar CPU’yu kullanılabilir durumda tutmak için boşaltma donanımını kapsamlı bir şekilde kullanır. Ana bilgisayarlar, x86 sistemlerinin desteklemediği şekilde çalışırken değiştirilebilir işlemcilere veya diğer bileşenlere izin veren özelliklerle verim, yedeklilik ve güvenliği vurgular.

Ana bilgisayarlar ayrıca çok yüksek yük seviyelerinde CPU yanıtını korur. x86 çekirdeklerinden daha az gecikme cezası alırlar ve G/Ç iş yüklerini daha ustaca yönetirler.

IBM Telum, sistem içinde biraz farklı bir role sahip olduğundan ve tipik bir x86 CPU’dan farklı bir şekilde düzenlenmiştir. çünkü ana bilgisayarlar kaynakları tipik bir sunucudan çok farklı şekilde tahsis eder.

Telum 7nm teknolojisi üzerine kuruludur ve 530 sq. mm’dir. AMD’nin Zen 2 Epyc’i gibi sekiz yonga ve bir G/Ç kalıbına sahip bir yonga, yongalar için kabaca 592 mm kare ve G/Ç kalıbı için 407 mm karedir. Epyc ayrıştırılmış bir yonga olduğundan ve System Z, belirli görevleri yerine getirmek için kalıp dışı denetleyiciler kullandığından, kalıp boyutunu karşılaştırmak bile biraz zor. Her Telum, çip başına toplam 16 iş parçacığı için SMT2 etkinleştirilmiş sekiz CPU çekirdeği içerir. Dört yuvalı bir çekmece, 2 GB sanal önbelleğe sahip çift yongalı modüllerde (toplam 64 çekirdek) sekiz yonga içerir ve toplam 32 yonga (256 çekirdek / 512 iş parçacığı) için dört çekmece bağlanabilir.

Telum, IBM’in önceki z-15 mimarisinden önemli bir ayrılmadır.

Telum bunu yalnızca 16 çekirdeğe çıkarmakla kalmaz, aynı zamanda önceki z makineleriyle karşılaştırıldığında kalıp üzerinde yeni işlevleri entegre eder.

Her Telum çekirdeğinin kendi L1’i ve 32MB L2’si vardır. Bir CPU çekirdeğine eklenen L2 önbellek verileri farklı bir çekirdeğin L2 önbelleğine aktarılabildiğinden, tüm önbellek ayrıca her bir Telum yongası için 256 MB “sanal” L3 işlevi görebilir. Benzer şekilde, dört yuvalı bir çekmecenin L2 önbelleği, çekmecedeki tüm yongalar arasında 2 GB sanal L4 önbellek olarak adreslenebilir. L2 önbellek, yalnızca 12 ns ortalama gecikme süresine sahip 320 GB/sn çift yönlü bir halka veriyolu kullanır. IBM, Telum’un 5 GHz’in üzerinde çalışacağını iddia ediyor ki bu, bu kompleksteki bir çip için küçük bir başarı değil.

Telum’da, IBM’in benimsediği farklı yaklaşımı göstermeye yarayan yeni bir özellik Intel’in aksine çip tasarımına – yeni bir AI hızlandırma motorudur. Yeni motor, 8 yönlü FP16 işlemleri için tasarlanmış 128 işleme döşemesi ve 8 yönlü FP32 / FP16 hesaplamaları için 600 GB/sn veri yolu ile bağlanan 32 döşeme içerir. Intel veya AMD bir AI hızlandırma birimi oluşturduysa, büyük olasılıkla bu işlevselliğin çekirdek başına eklendiğini görürüz.

Mikro mimari, CPU çekirdeği başına 1 × 512 bit kayıt sunuyorsa ve 12 çekirdeğiniz varsa, 12 kaydınız var demektir. 24 çekirdeğiniz varsa 24 kaydınız vardır.

IBM’nin AI birimi, aksine, herhangi bir CPU çekirdeğinden eşit olarak adreslenebilir. Bunun yerine, AI birimi, üzerinde işlendiği çipten hiç ayrılmadan veriler olmadan aynı anda birden fazla CPU çekirdeğine hizmet eder. Bu, Intel veya gelecekteki bir AMD CPU’da çalışan AVX-512 talimatları için de geçerli olsa da, bugün birçok AI iş yükü GPU’larda çalıştırılıyor. Bu nedenle, veriler gerektiğinde CPU’dan akar ve ana bilgisayarlar, tüketici ve sunucu donanımının olmadığı şekilde her düzeyde güvenli olacak şekilde tasarlanmıştır. Verileri kalıpta tutmak bu alanda değerli bir varlıktır. IBM, özellikle arka planda yapay zeka görevlerini CPU kullanılabilirliğinden veya yanıt verme hızından ödün vermeden çalıştırmak isteyen müşteriler için bu yeteneği bir katma değer olarak kullanıyor.

x86 olup olmadığı konusunda her iki yönde de çalışan makaleler var. sunucular IBM ana bilgisayarlarının yerini alabilir veya tam tersi olabilir ve her ikisi de her bir çözümün birbirinin etrafında tur atabileceğini iddia eder.

Ana bilgisayarlar ve tipik kurumsal x86 sistemleri farklı amaçlar için satılmaktadır. Farklı işletim sistemleri çalıştırıyorlar ve onlarca yıllık farklılaşmanın ardından belirli ölçütlerde en yüksek performansı sunmaya odaklanıyorlar. Bir CPU ve RAM’i veya yüzde 99.999999 çalışma süresini çalışırken değiştirme yeteneğine ihtiyacınız yoksa, ana bilgisayarlar uygun bir çözüm olmayabilir. Bunlara ihtiyacınız varsa, bir ana bilgisayar en akıllı seçim olabilir.

X86 pazarını doğrudan çok fazla etkilemese bile IBM’in ne üzerinde çalıştığını görmek her zaman ilginçtir. Başka bir şey değilse de, IBM’in z-sistemi, tüketici bilgi işlem tarihinde alınmamış bir yolu ve yaptığı işte çok iyi olarak x86’nın egemen olduğu bir dünyada güncelliğini koruyan bir CPU türünü temsil ediyor. Telum’un, muhtemelen 14nm’den 7nm’ye geçişi ve gelişmiş sistem mimarisini yansıtan soket başına performansta yüzde 40’lık bir artış sağladığı söyleniyor.

Şimdi Okuyun:

IBM, İlk Kuantum Bilgisayarını Amerika Birleşik Devletleri Dışına GönderiyorIBM, GlobalFoundries’i 2.5 Milyar Dolarlık Harcanmış İşlem Düğümü Geçişleri İçin Dava AçtıIBM, Nanosheets Kullanarak Dünyanın İlk 2nm CPU’sunu Yarattı.