ExtremeTech Açıklıyor: Sinir Ağı Nedir? – Aşırı Teknoloji

Fotoğraf: Mike MacKenzie, FlickrMoore Yasası sona yaklaşırken, teknosfer bilgi işlem için farklı ve daha çeşitli yaklaşımlar aradı. Sistemlerimizin hesaplama gücünü artırmaya devam etmek için, sadece daha yüksek ve daha yüksek saat hızlarına güvenemeyiz ya da transistörleri giderek küçültmeye devam edemeyiz. Gerçekten ilerlemek için yeni bir paradigma düşünülmeli ve geleceğe bakarken, bilgisayarlar ve insan beyni arasında karşılaştırmalar boldur. Sonuçta, her şey hesaplama gücü ile ilgili ve bu, beynimizin görünüşte bilgisayarlardan daha iyi olduğu bir alan. Bu nedenle, bir sonraki adım, açıkça denemek ve beynimize benzer çalışan bir bilgisayar yapmaktır.

2016’da tahmin ettiğimiz gibi, Yapay Zeka (AI), insan sağlığı alanındaki mevcut teknolojik devrime güç veriyor. Ayrıca, bilgi işlem teknolojisinin ilerlemesinde sinir ağlarının bir sonraki sınır olabileceği görülüyor. İnsan bağlacı hakkındaki anlayışımızı ve beynimizin bilgiyi işleme biçimini artırdıkça, onun olağanüstü bilgi çıktısını anlama yeteneğimiz de art arda büyür. Bu, Nöromorfik bilgi işlem araçlarının popülerlik kazanmasına yol açmıştır.

Bu kılavuzun, sinir ağları hakkında kısa ama kapsamlı bir başlangıç ​​olması amaçlanmıştır.

Pek çok yapay sinir ağı veya YSA türü vardır, bu yüzden birazdan bunu ele alacağız. Şimdilik donanımı ele alalım.

Bilgisayarların beyinle karşılaştırılması hem geniş hem de derindir. Bunun nedeni, hem beyinlerin hem de bilgisayarların hem anlamsal hem de yapısal düzeyde benzer olmasıdır. Her ikisi de yüksek hacimli bilgi işlemeden sorumlu, birden çok katmandan oluşan kıvrımlı ağlardır. Her ikisinin de arabelleği bozulabilen veya taşabilen çalışan bir hafızası vardır. Her ikisinde de, verilerin bir sabit disk plakasında farklı yerlerde nasıl depolandığına benzer şekilde, beynin yüzeyi boyunca kaba bir anlamsal hiyerarşide düzenlenen “soğuk depolama” vardır. Her ikisi de önemi, bağlantılarının “ağırlıkları” ile bireysel olarak ifade edilen bir düğüm ağından oluşur. Düğümleri, diziye gömülü verileri olan bir dizi elektrik sivri uçlarını kullanarak iletişim kurar.

Ancak, beyni bir CPU ile karşılaştırdığınızda analoji bozulur, çünkü beynin süregelen “TÜMÜNÜ paralelleştirme” alışkanlığı nedeniyle. BİR ŞEYLER.” CPU’lar, beyin bölgelerinin olmadığı şekilde bir veri hattına bağlıdır. Daha yakın bir benzetme, beyni, konektomunun toplamı olarak bir FPGA ile karşılaştırmak olacaktır.

Nöral plastisite, beynin donanımı “tamamen olgunlaştıktan” sonra bile, sinaptik ve elektrik yazılımının güncellemeleri almaya devam edebileceği anlamına gelir. Çevre değiştikçe beyin uyum sağlar.

Göz bir kamera değildir, ancak önemli bir anlamda öyledir; retinanın yapısı, optik sinir boyunca görsel kortekse kadar devam eden düzenli bir görsel alan haritasında düzenlenir. Görme alanının sorunlu kısmına dayanarak, optik sinirde bir yaralanmanın nerede meydana gelmiş olması gerektiğini teşhis edebiliriz. Retinanın işlem katmanlarındaki her nöron, yukarı akış bildirir. Gözün yakalama aygıtı olan retinayı, Hubble’ın görüntülerini yakalamak için kullandığı gibi bir CCD kameradaki sensörler ızgarasıyla karşılaştırabilirsiniz. Aynalar, CCD’ler ve retinalar sadece aldıkları iki boyutlu foton akışını yakalar. İki boyutlu bir foton akışına video da denir.

Benzer şekilde, beyin bir bilgisayar değildir, ancak bir tür bilgisayardır. Hatta beynin birçok ateşleme ritmini zaman içinde organize eden ve onları bir şarkıdan farklı olmayan düzenli ve katmanlı bir kompozisyona sokan dahili bir saatimiz bile var.

Özet olarak, sinir ağları tipik olarak üç temel bileşen üzerinde detaylandırılmıştır: Sinirsel ağ, nöronlardan veya düğümlerden ve bunların bağlantılarından ve ağırlıklarından oluşan bir sistemdir.

Bazı sinir ağları kendi sonuçlarını gözlemleme ve bir göreve yaklaşımlarını değiştirme yeteneğine sahiptir.

Neden Beyni Taklit Ediyoruz?

Kısacası, şunu istiyoruz: beyni taklit etmek çünkü beyinler yaptıkları işte gerçekten iyidir. Hızlı, hafif ve çok düşük güçlüdürler. İnsan beyninin peta ölçekli bir bilgi çıkışına sahip olduğu düşünülüyor – şimdiye kadar inşa ettiğimiz herhangi bir PC’den çok daha fazla. (Dağıtılmış süper bilgisayarlar sayılmaz.) Ve beyin yaklaşık yirmi watt ile çalışır. Bu kazanan kombinasyon, kısmen fiziksel yapısından ve kısmen de bilginin sinir sistemi boyunca benzersiz bir şekilde hareket etmesinden kaynaklanmaktadır. Beyinler aynı anda paralel ve seri, ikili ve analog olarak çalışır.

Nöronlar ateşlendiğinde, bu impulslar aksonlarda seri olarak ilerler. Ancak nöronlar kortikal sütunlarda düzenlenir ve kortikal sütunlar beyin bölgelerine yerleştirilir. Bu şekilde, birçok hücrenin tüm beyin bölgeleri aynı görev üzerinde paralel olarak çalışabilir.

Nöronlar birbirleriyle iletişim kurarak, alarak, yorumlayarak ve ardından küçücük bir elektrik dalgasını dalga boyu boyunca yayarak iletişim kurarlar. akson.

Özellikle kortikal nöronlar, derinden dallanan bir yapıya sahiptir. Fiziksel olarak yanlarında olan komşularına ve bilgi akışında kendilerinden önce gelen “yukarı akış” nöronlarına “çoktan” bir şekilde bağlanırlar. Ayrıca, alt iş arkadaşlarıyla iletişim kurarken “birden çoğa” bir şekilde bağlanırlar. Tüm bu yüzeyleri yönetmek için, sinapslar kurarak bağlantıların “ağırlığını” önem sırasına göre analiz ederler.

Nöronlar ayrıca bilgileri analog anlamda işler: Nöronlar, örtüşen, gerçek – dendritlerden gelen girdilerin zaman titriyor. Fizyolojik bir Fourier dönüşümüdür. Ancak nöronlar, mesajlarını nasıl ilettikleri konusunda da güçlü bir şekilde ikilidir. Bir nöronun sinyali, zaman alanında düzenlenen elektrik ani yükselmelerinden oluşur ve ani yükselmeler genlik bakımından değişmez. Bir nöron ya yükseliyor ya da gelmiyor. Sivri uçlar, küçük bir gezici zaptan oluşur. Spike trenler, veri parçalarını içeren zamanla sınırlı elektrik dalgaları dizileridir. Neredeyse bir Mors kodu alıcısı gibi.

Donanım ve Yazılım Sinir Ağları

Beyin işlevine fiziksel yapısının ortaya çıkan bir özelliği olarak yaklaşmak bizi bir bir “sinir ağı”nın donanım yorumu. IBM’in 2014’te üretilen TrueNorth’u, evrişimli bir sinir ağını barındıran çok çekirdekli bir nöromorfik CMOS çipiydi.

Benzer şekilde, Intel’in Loihi ekosistemi, ilişkili bir yazılım çerçevesine sahip bir donanım sinir ağıdır. Loihi, nöromorfik bir çiptir ve Lava, Loihi’nin güçlerine giden yazılım erişim yoludur.

Loihi’nin fiziksel mimarisi, beynin fiziksel organizasyonunu taklit eder. Geleneksel yarı iletken malzemeler kullanılarak yapılmış ve gelecekte bir Intel 4 işlem düğümünde üretilecek olsa da, Loihi hepimizin alışık olduğu silikondan çok farklı bir şekilde organize edilmiştir. Loihi’nin bir milyona kadar nöronu vardır: ağdaki her biri 128 kB belleğe bağlı bireysel varlıklar. Bu bilgi havuzu, sinapslar için çipin analoğudur. Herhangi bir zamanda nöronun bağlantı durumunu yansıtır. Nöronların ateşleme ritimlerini düzeltmek için harici bir saat uygulayan bitişik x86 çekirdekleri tarafından denetlenir. Süpervizör çekirdekleri ayrıca periyodik olarak nöronları grubun geri kalanına karşı hafızalarını kontrol etmeye veya bağlantılarının gücünü yeniden hesaplamaya zorlar.

Intel Loihi 2

Bu yapı hiyerarşik yapıyla eşleşir ve beynin organizasyonunun paralel yönleri.

Loihi 1 nöronlarını ikili olarak ateşledi: bir veya sıfır, arada hiçbir şey yok. Loihi 2, sivri uçlarını tamsayılar olarak kodlayarak meta veri taşımalarına izin verir. Aynı zamanda, aşağı akıştaki nöronlar üzerinde bir miktar etki gösterebilecekleri anlamına gelir. Tamsayı değerlerine sahip sivri uçlar, bir nöronun gönderebileceği veya alabileceği farklı elektrokimyasal sinyallerin kataloğunu taklit edebilir.

Geliştiriciler, Python kullanarak Loihi ve Lava ile arayüz oluşturabilir. (Bu kulağa oldukça tropik bir macera gibi gelmeye başlıyor.) Loihi sistemi eninde sonunda araştırmacıların kullanımına sunulacak, ancak tüketici uygulamaları düşük önceliğe sahip.

Başlıca Sinir Ağları Türleri

Katmanları ve fazlalıkları ile sinir ağları, son derece paralel görevlerin üstesinden gelmede mükemmeldir. Ayrıca, kullanıcının içindeki kalıpları belirlemek için büyük miktarda veri almasını gerektiren görevlerde de yardımcı olurlar – buna genellikle “yangın hortumundan içmek” denir. Büyük verilerin avantajlarından yararlanmak için, onu kullanışlı bir hızda işleyebilmemiz gerekir. Sinir ağları ayrıca meta verilerle veya birçok boyutla verileri manipüle etmede de başarılıdır.

Birçok farklı bireysel sinir ağı projesi vardır, ancak hepsi birkaç farklı işlev ailesine girer.

Burada, sinir ağlarının dört ana alt türünü tartışacağız: evrişimli, tekrarlayan, üretken çekişmeli ve hızlı artış.

Evrişimli Sinir Ağları: Evrişimli sinir ağları (CNN’ler) “besleme”dir. -ileri” sistemler, bu da bilgi akışının ağ üzerinden tek bir yönle sınırlı olduğu anlamına gelir. İşlem yapabilen ancak cevaplarına nasıl ulaştıklarını açıklayamayan AI’ların / sinir ağlarının medya raporlarında bu tür sinir ağlarından bahsedildi. Bunun nedeni, evrişimli sinir ağlarının çalışmalarını göstermek için inşa edilmemesidir. Bir giriş katmanı, bir veya daha fazla gizli katman ve bir çıkış katmanı veya düğümden oluşurlar.

CNN’ler genellikle görüntüleri işlemek için kullanılır. İleri beslemeli oldukları için, matematiksel olarak CNN’ler ızgara biçiminde gelen veriler üzerinde harika işler çıkarır. Görüntüler ve diğer matrisler gibi iki boyutlu veri dizilerine uygulandıklarında sağlamdırlar. Kaputun altında, algoritmayı yalnızca iki sayı, terim veya denklem üzerinde değil, aynı zamanda bir resmi büyütmek gibi tüm veri gövdesinde işlemlerin nasıl gerçekleştirileceği konusunda yönlendiren uzun bir matematiksel formül uyguluyorlar.

Feed -ileri ayrıca belirli bir miktarda ölü hesaplaşma gerektirir.

2016’da MIT, görüntüleri “korkutucu hale getirmek” için bu kaçak davranışı kullanabilecek ve Cadılar Bayramı için tam zamanında bir kabus yakıtı seli üretebilecek bir yapay zeka yayınladı.

Tekrarlayan Sinir Ağları: In İleri beslemeli yaklaşımın aksine, tekrarlayan sinir ağları geri yayılım adı verilen bir şey yapar. Geri yayılım, nöral ağda daha derinden daha sığ seviyelere bilgi aktarma eylemidir. Bu tür bir algoritma kendi kendini geliştirme yeteneğine sahiptir.

Tekrarlayan sinir ağları, sistemdeki diğer nöronlarla bağlantılar kurarak geri yayılım gerçekleştirir – her nöronun diğer her nörona bağlı olması da dahil olmak üzere bir ölçekte . Bu fazlalık son derece doğru sonuçlar üretebilir, ancak azalan bir getiri tavanı vardır. Süper örnekleme kenar yumuşatmadan (SSAA) farklı değildir. Algoritma, halihazırda işlenmiş olan veriler üzerinde giderek daha fazla geçiş yaptığından, yapabileceği daha az şey vardır. 2xAA’dan 4xAA’ya geçmek açıkça fark edilebilir sonuçlar üretebilir, ancak deneyimli bir göz olmadan 8x ve 16xAA arasındaki farkı söylemek zordur.

Bu tür sinir ağı, bir analiz yöntemi olan gradyan inişi kullanılarak eğitilebilir. bu, üç boyutlu bir olasılıklar manzarası yapar.

Daha önce de söylediğimiz gibi, eğimli iniş en iyi sinir ağı eğitim yöntemi değildir, ancak güçlü bir araçtır. Tekrarlayan sinir ağları, değişen manzaranın eskiden nasıl olduğuna dair bir miktar hafızayı koruyarak gradyan inişini hızlandırabilir.

Spiking Sinir Ağları: Yukarıda gördüğümüz gibi, nöromorfik tasarım geliyor hem fiziksel hem de dijital formatlarda. Tek bir CPU üzerinden sürekli çalışan bir ikili veri akışı yerine, ani sinir ağları yazılım, donanım veya her ikisi olabilir. Sinyallerini iletmek için “spike tren” adı verilen bir kadansta ateşlenen, fiziksel veya mantıksal, merkezi olmayan çekirdeklerden yapılmıştır. Bu çekirdek dizileri ortak bir ağ yapısı tarafından birleştirilir ve her nöron bu ağ içindeki bir düğümdür.

Nöronların birçok I/O kanalını yönetme şeklini modelleme girişimleri bize, bilgilerin kodlanmış olduğunu öğretti. birçok farklı kanalda. Nöronun ateşlenip ateşlenmediği ile ilgili veriler ve ayrıca ani yükselmeler dizisinde de veriler var. Aynı zamanda, ağ bağlantılı meslektaşlarından hangisinin aynı anda işten çıkarıldığı da önemlidir.

Nöromorfik hesaplamadaki önemli araçlardan biri “sızdıran entegre ve ateşle” modelidir. Nöronlar arasındaki iletişim, her bir nöronun farklı I/O’larını tanımlayan bir dizi diferansiyel denklemle modellenir.

Bazı bağlamlarda, rastgele bir n-boyutlu karşılaştırıcılar kümesini modellemek için diffEQ’ları kullanabilirsiniz.)

Spiking ağdaki her nöronun bir ağırlığı vardır. Ağırlık, nöronun son aktivitesinin yuvarlanan bir ortalamasını temsil eder. Daha fazla aktivasyon, değeri daha yükseğe iter. Ancak ağırlık, bir kovada delik olması anlamında “sızdırıyor”. Zaman geçtikçe, her nöronun ağ ağırlığını yavaş yavaş azaltan bir bozunma işlevi vardır. Bu, biyolojik olarak her nöronun her zaman aktif olmadığı fikrini açıklar. Bunu, yinelenen bir sinir ağındaki kalıcı olarak doymuş bağlantı çelengiyle karşılaştırabilirsiniz.

Spiking ağlar, eğim inişinde veya bu tür optimizasyon problemlerinde o kadar iyi değildir. Bununla birlikte, biyolojik fonksiyonları modellemek için benzersiz bir şekilde uygun olabilirler. Artan ağlar daha karmaşık hale geldikçe, bir dizi ani artış içinde daha fazla bilgiyi kodlayabilir hale gelebilirler. Bu, sinir sisteminin çeşitli işlevleri üzerinde çok daha yakın bir hesaplama geçişi sağlayacaktır. C. elegans yuvarlak solucanlarının ve Drosophilia meyve sineklerinin sinir sistemlerini zaten simüle ettik ve araştırmacılar gerçek zamanlı olarak bir insan kortikal kolonunu simüle etmeye çalışıyorlar.

Sinir ağı araştırmalarını hızlandırmak için başka bir olası yön, ek soyutlama seviyeleri.

GAN’lar, görüntüleri değiştirmek veya oluşturmak için sıklıkla kullanılan yapay zekanın başka bir evrimidir. “Düşman” kısmı, bu sinir ağlarının kendileriyle rekabet edecek şekilde inşa edildiği anlamına gelir.

Tıpkı Cerberus’un üç kafası olduğu gibi, bir GAN içinde genellikle, biri üretken ve bir tane olmak üzere kendi amaçları olan iki ayrı sinir ağı vardır. ayrımcı. Üretken model, genellikle bir görüntü olmak üzere bir sonuç üretir. Ardından üretici taraf, istenen çıktıya ne kadar yaklaşabileceğini görmek için ayrımcı modeli “kandırmaya” çalışır. Ayrımcı taraf aldanmazsa, sonuç atılır. Bu yargılamanın sonuçları, hem üretici tarafın başarısı hem de yaptığı içerik dosyalanır; bazen öğrenme denetlenir, bazen de denetlenmez. Ancak her iki durumda da, her bir değerlendirme turundan sonra GAN, çizim tahtasına geri döner ve yeniden dener. İkili başarıya bu şekilde ulaşır.

GAN’lar, gerçek dünyada olmayan insanların benzersiz, fotogerçekçi görüntülerini üretme yeteneğine sahiptir. Bunu yapmak için, birbirimizden ne kadar farklı olduğumuza ve birbirimize nasıl benzediğimize dair veri toplamak için gerçek insanların birçok fotoğrafına bakarlar. Aslında, bu kaba kuvvet fenotiplemesidir.

Bir örnek, şaşırtıcı, aldatıcı gerçekçilik görüntüleri üretebilen Nvidia’nın StyleGAN’ıdır. İzleyicileri bir kişinin belirli bir StyleGAN resminin gerçek mi yoksa sahte mi olduğunu belirlemeye zorlayan bir türev proje bile var.

Bu resimdeki kişi mevcut değil. Bu, Nvidia’nın üretken düşman sinir ağı StyleGAN tarafından oluşturulmuş derin sahte bir görüntüdür.

Bir GAN’ın çalışmasının sonuçları o kadar gerçekçi olabilir ki, 2019’da California eyaleti (her iki 2257 formun da evi) ve Hollywood), bir kişinin rızası olmadan derin sahte pornografisi oluşturmak için GAN’lar gibi teknolojilerin kullanılmasını yasaklayan bir yasa çıkardı. Devlet ayrıca, seçimlerden sonraki iki ay içinde siyasi adayların manipüle edilmiş videolarının dağıtımını da yasakladı. DARPA, her iki GAN’ı ve onları yenmenin yollarını incelemek için tam bir bölüm oluşturarak bu A/V silahlanma yarışını yakından takip etmeye çalışıyor.

Tüm bunlar kulağa çok stresli gelse de, GAN’ların bunu yapmayan kullanımları var. Herkese açık profil fotoğrafları için interneti kazımayı içerir. Bir uygulama parçacık fiziğidir; Fizikçiler, yeni bir parçacık bulduklarını veya bir fenomeni açıkladıklarını söylemeye istekli olmadan önce ölçümlerinde mükemmel bir kesinliğe ihtiyaç duyarlar.

GAN’ların öne çıktığı bir başka yer de oyun teorisidir.

Bu tür sinir ağı, astronomik görüntüleri iyileştirmek ve kütleçekimsel merceklenmeyi tahmin etmek için de inceleniyor.

Yaz 2021, kendi yazılımını geliştirebilen üretken bir sinir ağı olan CodexAI’nin piyasaya sürüldüğünü gördü. Model, doğal dili koda çevirebilir. Ayrıca, tüm Github’ı besledikten sonra anlaşılır kod parçacıkları oluşturabilir.

CodexAI kendi özelliklerine göre tam teşekküllü bir sinir ağı olarak kabul edilebilirken, aynı zamanda kolayca çok daha büyük bir sistemin parçası olabilir gibi görünüyor. , hiyerarşik sistem. CodexAI’nin davranışı, ilk sinapslarını kurarken yalnız bir nöronun ilk bocalayan kıvılcımlarına benzer. Aynı zamanda teknolojinin sınırlarını da gösterir. Sinir ağları varsayımlarını düzeltmeyi öğrenebilir, ancak AI’nın erişimi hala kavrayışını aşıyor. Geleceğin yolu, birden fazla farklı modeli entegre etmektir.

Sinir Ağları Nerelerde Düşer?

Sinir ağları, belirli ve iyi kısıtlı gereksinimleri karşılamada mükemmeldir. istekler, ancak aşırı istekli olabilirler. Bilgisayarların en büyük gücü, tekrarlayan işlemleri gerçekleştirebilme hızlarıdır. Bu hızlı yinelemeler, bir sinir ağını aşırı eğitmeyi de mümkün kılar. Bu olduğunda, ölü hesabı tamamen ters gider.

Daha güçlü olmak için bir sinir ağının büyümesi gerekir ve ovma da burada yatar. Sinir ağları sonsuza kadar ölçeklenemez. Ölçeklendirme verimliliği, sinir ağlarını bu kadar yetenekli yapan şey nedeniyle, normal bir veri merkezinden daha kötüdür. Katmanlı sinir ağının merkezi konsepti, katmanlı derinliği ve fazlalığı, katlanarak artan miktarda güç gerektirir. Şimdiye kadar amaçlarımıza ulaşmak için kaba kuvvet kullanıyoruz ve bu bir noktaya kadar işe yarıyor.

Güç ölçeklendirmeyle ilgili bu sorun, Intel’in birincil satış noktası olarak Loihi’nin düşük güç tüketimini kullanmasının nedenidir. Sonunda, güç kullanımı ve termal yayılımın bir araya getirdiği zorluklar, daha büyük ve daha karmaşık AI’lar yapmak için bu çiplerden daha fazlasını birbirine bağlama yeteneğimize katı bir sınır koyacaktır.

Son Düşünceler

Sinir ağı ile yapay zeka arasındaki fark büyük ölçüde bir fikir meselesidir. Bir düşünce okulu, sinir ağını kendi başına bir yapay zeka olarak görür. Diğerleri, yapay bir zekanın alt sinir ağlarından yapıldığını düşünür.

Büyük veri. Uç bilgi işlem ve veri bilimi yükselirken, analizimize yepyeni bir bilgi alanı açılıyor. Her gün üretilen şaşırtıcı miktarda ham veri var. Onu kullanmanın yaratıcı ve akıllı yollarını bulmak bize kalmış.

Şimdi Okuyun:

Bilim Adamları Beethoven’ın Onuncu Senfonisini Bitirmek İçin Yapay Zeka OluşturduAI Amazon Teslimatını Cezalandırıyor Yapmadıkları Hataların SürücüleriYeni Yapay Zeka Kendi Bilgisayar Kodunu Yazıyor.