Bu hafta Intel, Alder Lake CPU ailesiyle ilgili önemli ayrıntıları paylaştı ve CPU’nun çekirdek tasarımı, performansı ve beklenen güç verimliliği hakkında daha önce sahip olduğumuzdan çok daha fazla bilgi paylaştı.
Bu kritik bir nokta. Intel için lansman. Üreticinin masaüstü CPU’ları altı yıldan fazla bir süredir 14nm’de takılı kaldı ve bu işlem düğümündeki çatlaklar en az iki yıldır görülüyor. Rocket Lake, güç verimliliğini önemsemediğiniz sürece şu anda pazarın orta ve alt ucunda AMD ile rekabet ediyor, ancak AMD’nin üst uçta bir avantajı var. Alder Lake bunu değiştirmeyi amaçlıyor. Pat Gelsinger, tasarıma çok fazla katkı sağlayacak kadar uzun süredir Intel’in CEO’su olmasa da, görev süresinin ilk büyük lansmanı ve Intel’in 10nm düğümünün bir sonraki yinelemesi üzerine inşa edilen ilk ürün.
14nm’de altı yıl takılıp kaldıktan sonra, Intel’in süreç ve performans liderliğini yeniden yakalayabileceğini göstermesi gerekiyor. Kimse bunun bir gecede olmasını beklemiyor, ancak Gelsinger, Chipzilla’nın iş modeliyle sonuca bahse girdi. Intel, bazı aktivist yatırımcı firmaların istediği gibi, salt dökümhane ortaklıklarına yönelmek ve kendi donanımını kurmaktan uzaklaşmak yerine, dökümhane işinin her iki tarafı için aynı anda bir oyun oynamayı seçti.
Kendi yongalarını oluşturduğu için Intel, CPU’nun gerçekten bu vaadi yerine getirmesi koşuluyla, Alder Lake’i gelişmiş rekabet gücünün kanıtı olarak kullanabilir. Alder Lake ayrıca Apple’ın kitabından bir sayfa alan ve hem “büyük” hem de “küçük” çekirdekleri dağıtan ilk x86 CPU’dur.
Gracemont ile Tanışın
Alder Lake, aşağıdakileri içeren hibrit bir CPU’dur. iki farklı CPU çekirdeği türü. Verimlilik çekirdekleri, 2008’de orijinal Atom’dan geliştirilen Intel’in düşük güçlü mimarisi Gracemont’a dayanmaktadır. Performans çekirdekleri, yeni bir mimari olan Golden Cove’a dayanmaktadır. Bunlar Intel’in en yeni küçük ve büyük çekirdek standartlarıdır ve her ikisi de yeni tasarımlardır. Önce Gracemont’tan bahsedelim:
Gracemont, Tremont ile ortak olan bazı tasarım öğelerini korur. Her iki CPU çekirdeği de çift 3 genişliğinde bir dekoder birimi sunar, ancak Gracemont talimat önbelleğini (64KB) ikiye katlar. Bu, Intel’in L1 komut önbelleğini ikinci kez artırmasıdır; Tremont, birkaç yıl önce 24KB’den 32KB’ye çıktı. CPU, Intel’in ilk isteğe bağlı komut uzunluğu kod çözücüsünü ve toplam yürütme bağlantı noktası sayısında 10’dan 17’ye büyük bir artış içerir.
Çıktı daha sonra komut verilerini kod çözücülere yönlendirmek için kullanılır veya gelecekteki getirme ve kod çözme işleminde başlangıcı/sonu işaretlemek için talimat önbelleğine paralel talimat baytlarıyla birlikte kaydedilebilir. Bu, x86’nın değişken uzunluklu talimatlarını telafi etmek için kullanılabilecek bir özellik gibi görünüyor ve CPU’ya daha fazla bilgi vererek ek verimlilik elde etmesine yardımcı olabilir.
Gracemont beş talimat verebilir ve Tremont dört talimat yayınlayabilir ve sekizini emekli edebilir ve saat döngüsü başına iki şubeyi çözebilir. Intel, Gracemont’un saat başına altı talimatın tümünü ne zaman çözebileceği ve kullanabileceği konusunda çok fazla ayrıntıya girmedi – çipte 6 genişliğinde bir çözüm değil, çift 3 genişliğinde kodlayıcı var – ancak Tremont piyasaya sürüldüğünde Intel, ikili üç Geniş çaplı kod çözücüler, büyük bir mikro işlem önbelleği veya birleşik altı genişlikli bir kod çözücü ile karşılaştırıldığında güç ve kalıp alanı tasarrufu sağladı.
Intel’e göre, “dört Verimli çekirdek yüzde 80 daha fazlasını sunuyor performans, dört iş parçacığı çalıştıran iki Skylake çekirdeğinden daha az güç tüketirken veya yüzde 80 daha az güç tüketirken aynı verim performansı.” Intel ayrıca Gracemont’un aynı güç zarfı içinde Skylake’ten yüzde 40 daha fazla tek iş parçacıklı performans veya yüzde 40’tan daha az güçle aynı performansı sağlayabileceğini iddia ediyor.
Unutulmaması gereken bir şey Bu iddiaları değerlendirirken akıl, Intel’in bir referans saat hızı veya TDP vermemesidir.
Core i3-6100U, 7.5W’lık yapılandırılabilir bir TDP’ye ve bu TDP’de 800MHz saat hızına sahipti. Intel, düşük TDP aralıkları ve saatleri içinde karşılaştırıyorsa, bu muazzam verimlilik artışını açıklar.
Gracemont, her biri 4 MB’a kadar L2, 17 döngülü bir L2’yi paylaşan dört çekirdekli paylaşılan bir L2 önbelleğine sahiptir. gecikme ve AVX, AVX2 ve AVX-VNNI’yi destekler. AVX-VNNI, AVX-512 spesifikasyonunun bir parçasıdır, ancak Intel tam AVX-512 desteği talep etmemektedir ve Gracemont’un yürütemeyeceği birden çok AVX-512 talimatı vardır. Bu iş yükleri Golden Cove tarafından ele alınacaktır.
Gracemont hakkında daha fazla bilgi istiyorsanız, Intel’in ek slaytlarından bazılarını aşağıdaki slayt gösterisine ekledik. Yeni bir pencerede tam boyutlu olarak açmak için her slaydı tıklayabilirsiniz.
Greet Golden Cove
Intel’e göre Golden Cove geliştirme mantığı “Daha Geniş, Daha Hızlı, Daha Akıllı” idi ve bu, CPU’daki çeşitli iyileştirmeleri özetlemenin iyi bir yolu.
CPU artık döngü başına 16 bayttan 32 bayt kod çözmeyi destekliyor ve mikro işlem sırası biraz daha geniş. Artık iş parçacığı başına 70’e kadar 72 girişi destekliyor ve mikro işlem önbelleği 2.25K’dan 4K mikro işlemleri tutabiliyor. Mikro-op önbellek isabet oranı ve ön uç bant genişliği artırıldı.
Artık daha derin bir yeniden sıralama arabelleğiyle (512 giriş, Sunny Cove/Willow Cove’da 352’den). L1 önbelleği artık ikiden fazla olmak üzere üç yükleme bağlantı noktasını destekliyor ve tek bir döngüde 3×256 bit yükleri veya 2×512 bit yükleri işleyebilir. L1 veri önbelleği artık 96 KB (Tiger Cove paketlenmiş 64 KB), 16 ön getirici ve ikiden dört sayfalık tablo yürüyüşünü destekleme yeteneği.
Golden Cove 1,25’ten birini sunacak İstemci bilgi işlem için MB L2 (düz ve Tiger Lake’e karşı) veya veri merkezi uygulamalarında 2 MB. Ayrıca, Intel’in AI performansında muazzam bir artış sağladığını iddia ettiği Intel’in yeni Gelişmiş Matris Uzantıları (AMX) uzantı setini de destekler.
AMX, aynı çipin döngü başına 2.048 INT8 talimatı yürütmesine izin verir.
Bu, ilgili uygulamalarda Intel’in CPU tabanlı AI performansını önemli ölçüde artırabilir, ancak SIMD’nin benimsenmesi ve optimizasyonu ile ilgili olağan uyarılar geçerlidir . AMX’in ticari uygulamalarda çokça kullanılması birkaç yıl alabilir, ancak performans artışları, Intel CPU’ların belirli AI ve makine öğrenimi ile ilgili görevler için Nvidia GPU’lara makul bir alternatif olabileceğini ima ediyor. CPU’lar zaten AI çıkarım iş yüklerini makul hızlarda gerçekleştirebilir, bu nedenle bunun AI modellerini eğitirken CPU performansını artırıp artırmadığını veya yalnızca çıkarımlarda onları daha rekabetçi hale getirip getirmediğini görmek ilginç olacaktır.
Tüm bunları ekleyin. İşte karşınızda:
Bu slayt aslında bence biraz yanıltıcı, ancak Intel’in lehine değil. Bir kez olsun, sıfırdan farklı bir başlangıç noktası kullanmak Intel’in daha iyi değil, daha kötü görünmesini sağlar. En kötü performans gösteren alt testte Rocket Lake ve Alder Lake arasındaki performans farkı grafiğin en sol tarafında ~ yüzde 92 iken, Alder Lake’in bir avuç testte 1,6 kata kadar daha hızlı olduğu bildiriliyor.
Rocket Lake, Comet Lake’e kıyasla IPC’yi artırdı, ancak Intel, TDP’nin çalışması için çekirdekleri geri almak zorunda kaldı. Sonuç olarak, sekiz çekirdekli bir RKL ve bir 10 çekirdekli CML, birçok uygulamada büyük ölçüde benzerdir. Alder Lake, üst düzey bir SKU’da toplam 16 çekirdek ve 24 iş parçacığı için sekiz adede kadar Golden Cove çekirdeğini ve sekiz adede kadar Gracemont çekirdeğiyle (her biri 1T) 16 GC iş parçacığını birleştirir.
Eğer isterseniz. Intel’in ek Golden Cove slaytlarına göz atmak istiyorum, bunları aşağıda ikinci bir slayt gösterisinde derledik.
Not: 10nm’yi birkaç kez yeniden markalaştırdıktan sonra Intel, işlem düğümleri için yeni bir isimlendirmeye karar verdi.
Intel 7 hala 10 nm’lik bir düğüm – eski isimlendirme altında “Gelişmiş SuperFin” olarak adlandırılacaktı – ancak Intel, watt başına performansta ve çeşitli FinFET transistör optimizasyonlarında yüzde 10-15’lik bir iyileşme olduğunu iddia ediyor. Intel’in uzun vadeli düğüm güncelleme planları hakkında daha fazla bilgiyi burada bulabilirsiniz.
Her Şeyi Birlikte Çalıştırmak
Küçük ve büyük çekirdekler arasında iş yüklerini karıştırmak için ek destek gerekir. Intel, Thread Director olarak adlandırılan yongalarına gelişmiş donanım planlamasını yerleştirdi. Thread Director, CPU’yu izler ve her iş yükünün uygun çekirdekte bitmesini sağlar.
Intel’in bize sunduğu demoları göstermek veya uygulamalı olmadan değerlendirmek zor olsa da , şirket, Thread Director’ın Performans ve Verimlilik çekirdekleri arasında birden çok iş parçacığını nasıl dağıtacağına dair bir örnek verdi. Aşağıdaki resimde yeşil görevler skaler iş yükleridir, turuncu görevler yeni başlatılan yeni bir AI iş yükünü temsil eder ve mavi görevler arka plan görevleridir.
Uygun koşullar altında, CPU programlayacaktır Hem Performans hem de Verimlilik çekirdeklerinde iş yükleri.
Thread Director’ın tanıtılmasından önce, işletim sistemi zamanlayıcısı, çalıştırdığı iş parçacığı veya hangi çekirdekte programlanması gerektiği konusunda hiçbir bilgiye sahip değildi. Intel’e göre, Thread Director bu boşluğu kapatıyor ve işletim sistemine zamanlama konusunda daha fazla bilgi sağlıyor. Çip ayrıca, mikrosaniyelik doğrulukla iş yükü planlama kararları alabiliyor ve zamanlama, Windows 11’in piyasaya sürülmesinden öncesine göre daha ayrıntılı.
Testler, Intel’in önceki hibrit CPU’sunun , Lakefield, Windows 10’a kıyasla Windows 11 altında yüzde 5-6’lık bir artış sağlayabilir. Lakefield, Thread Director’dan yoksundur, bu nedenle Alder Lake deltasının iki işletim sistemi arasında nasıl görüneceğini merak ediyoruz.
< /p>
Sistemin bu yönleri zaten biliniyor olsa da, Alder Lake, PCIe 5.0 desteği sunacak ve 9W – 125W TDP zarflarından ölçeklendirecek. ADL, CPU’ya bağlı 1×16 PCIe 5.0 yolu, tek bir x4 PCIe 4.0 bağlantısı ve güney köprüsü üzerinden 16 PCIe 3.0 ve 4.0 yolu sunar.
Bir x8 PCIe 5.0 bağlantısı, bir x16 PCIe 4.0 bağlantısıyla aynı miktarda bant genişliği sağlar, bu nedenle zorlu iş yüklerinde bile herhangi bir yapılandırmada bant genişliği cezası olmamalıdır.
Sonuç
Elimizde silikon olana kadar Alder Lake hakkında herhangi bir sonuç çıkaramasak da, Intel’in ortaya koyduğu bilgilerin derinliği ve genişliği, şirketin nihai üründe kendinden emin olduğunu gösteriyor. 1.19x IPC artışı, özellikle RKL’nin son nesil CML ile işleri çoğunlukla bağlamayı başardığı göz önüne alındığında oldukça iyidir. Sekiz çekirdekli bir Roket Gölü, 10 çekirdekli bir Comet Gölü ile kabaca eşleşebiliyorsa, sekiz çekirdekli bir Kızılağaç Gölü, görevlerin çoğunda kesinlikle daha hızlı olmalıdır.
Intel, herhangi bir somut karşılaştırma verisi paylaşmadı. veya belirli performans rakamları, ancak ifşa edilmesi hem güç verimliliğinde hem de ham performansta önemli kazanımlara işaret ediyor. AMD, V-NAND donanımlı Zen 3 yongalarının yaklaşık 1,15 kat performans kazanacağını tahmin ediyor, ancak bu yılın sonlarında veya 2022’nin başlarında piyasaya süreceği gelecekteki CPU’larda herhangi bir ek verimlilik veya performans artırıcı değişiklik henüz açıklamadı.
Şimdi Okuyun:
Yapay Zeka Destekli Elektronik Tasarım Otomasyon Araçları Yonga Yapımını Yeniden TanımlayabilirIntel’in Yeni Ark Markalı GPU’ları 2022’nin İlk Çeyreğinde Nvidia ve AMD ile Savaşacak Yeni Nesil CPU’lar İçin, Verileri Hareket Etmiyor Yeni 1GHz.