Bazen, İnternet’ten bir AI içeriği beslediğinizde, doğal dili öğrenir. Bazen GitHub’ın tüm içeriğini okur ve basit kod parçacıkları oluşturmayı öğrenir.
Bu, AI her ikisini de yaptığında neler olduğunun hikayesidir.
Sinir ağlarının tümü bu günlerde öfke. Siri’den kendi kendine sürüşe, protein katlama ve tıbbi teşhise kadar, güçlü makine öğrenimi ve büyük veri ikilisi devralıyor. Sinir ağları tek hileli midilliler olarak başladı: Bir Markov zinciri, 2005 WMSCI konferansına (“spam içerikli ve düşük standartlara sahip”) incelenmemiş bir makale olarak kabul edilen bir gobbledygook teknik incelemesi oluşturdu. Bir Markov zinciri, “Garkov”un Kafkaesk ihtişamını yarattı. Bir diğeri, her şeyin bir göz küresi veya bir kedi gibi göründüğü tuhaf görüntüler oluşturabiliyordu.
Yapay zekanın erişimi hâlâ kavrayışını aşıyor. Yüz tanıma yazılımındaki başarısızlıklar ve başarılar, hem AI’nın sınırlamalarını hem de makine öğreniminin bile veri kümelerinin ve programcıların örtük önyargılarına nasıl duyarlı olduğunu ortaya koyuyor. Ama SmarterChild’den çok yol kat ettik. Her yıl daha önce yaptıklarımızı geliştiriyoruz.
Resim: xkcd
Bir yapay zekayı doğal dile o kadar yakın bir düzyazı üretmesi için eğitebilirsiniz ki, insanlar onu kimin yazdığını söylemekte zorlanırlar: man veya makine.
Diğer düzyazı ve kod alt kümelerinin yanı sıra Wikipedia ve bir sürü kitap içeren Ortak Tarama veri kümesinin bir bölümünü kullanarak onu eğittiler. Ancak Common Crawl, GitHub’ı da indeksler. GPT-3, Common Crawl verilerinin geniş bir yelpazesine maruz kaldığında, düzyazı üretmeyi öğrendi – ama aynı zamanda ozmoz yoluyla anlaşılır bilgisayar kodu parçacıkları üretmeyi de öğrendi.
İlgilenen OpenAI ekibi başka bir sürüm yaptı. GPT-3 modelinin bir parçasıydı ve ona Codex adını verdi ve onu Common Crawl’dan gerçekten devasa bir düzyazı seti ve GitHub’dan ve başka yerlerden bilgisayar kodu üzerinde eğitti. (Codex özel betaya girdi, ancak teknoloji aslında Copilot adlı akıllı bir kod önerme aracını güçlendirmek için kullanan GitHub tarafından kullanılıyor.) OpenAI Codex, girdi olarak doğal dil istemini alabilen akıcı bir yapay zekadır, ve verilen görev için kod oluşturun. Bazen harikadır.
Codex Neden Bu Kadar Güçlü ve Bu Kadar Kusurlu Olabilir
Codex’in en büyük gücü akıcı olmasıdır. 12 dilde kod üretebilir ve doğal dil girdisini esnek bir şekilde işlemesi son derece güçlüdür. Ama bu aynı zamanda önemli bir zayıflık. Kodlama sıkıcıdır çünkü ayrıntılara çok duyarlıdır, ancak doğal dil dağınıktır ve bağlama bağlıdır.
Ayrıca iyi kodlar ve kötü kodlar ve web’de yayınlanan sadece garip kodlar var.
Codex aynı sorundan etkilenebilir. Bir Markov zincirinin aksine, Codex eylemlerinin bir kaydını bir önbellekte tutar, ancak kapsamı hala sınırlı ve sığdır. Soyut olarak katı sözdizimi ve programlamanın mantık kuralları ile sınırlandırılmıştır. Ayrıca, kullandığı gerçek verilerdeki kalıplar ve örtük kurallar tarafından da sınırlandırılmıştır. Ve ona enterpolasyon yapmasını söylemezsek, olmaz.
Başka bir deyişle, Codex istediğinizi yapan kodu döndürebilirken, bu işlevi neden istediğinizi bilmiyor ve onun mantığı mutlaka açık olmayacaktır. Bu, matematiksel bir kanıt yazmak gibidir: Aynı cevaba giden, bazıları dolambaçlı birden çok yol olabilir. Bazen Codex, bir insan programcının yapabileceğine hiç benzemeyen bir kod döndürür, ancak kesinlikle aynı şeyi başarır. Bazen kodunda güvenlik açıkları olabilir veya hiç çalışmayabilir. Zamanın yüzde otuz yedisi her zaman çalışır.
Codex kısmen şu nedenle çok sağlamdır: veri kümelerinin gücü.
Bunların tümü, Codex’in çalışması için meta veriler, anlamsal bilgiler ve dahili kurallar açısından zengindir ve ayrıca bize insanların konuştuğumuz dilleri kullanma biçimleri hakkında çok şey söyler. Codex birçok konuşulan dilde akıcıdır, ancak konuşma dili ve Python arasında da çeviri yapabilir – hem sizden istediğinizi yapan kodu oluşturur hem de size kodu sade bir dilde açıklar. Codex’i programlama kodu konusunda eğitmek için yaptıkları birçok şeyden sadece biri, onu Python ve diğer on bir büyük programlama dili ile beslemekti.
Uzun süredir, AI’nın ilerlemesi, bir öğrenme algoritmasını diğerine beslemek olacaktır. Başlık altında, AI, verilerdeki kalıpları bulmak için matematiği kullanabileceğiniz fikrine dayanır. Diğer tüm kodların sahip olduğu aynı çöpe giren çöp sınırlamalarına sahiptir. Denetimsiz öğrenme yapan karmaşık sinir ağları bile, biz onlara neyi arayacaklarını söylemedikçe neyin başarı koşulu olduğuna karar veremezler. Ancak AI’nın en büyük gücü yinelemedir. Bir AI, biri ona durmasını söyleyene kadar aynı problem üzerinde yineleyerek, geniş veri alanları arasında metodik olarak ilerleyecektir. Sinir ağları, jet motorlarının kazları yemesi gibi verileri alır.
Burada, yapay zeka araştırmalarındaki son teknoloji ile insan beyninin fizyolojisi arasında yapılabilecek gerçek bir karşılaştırma var.
AI ile ilgili bir sınırlama, kuralların birkaç bağlamsal katman derinliğinde olabilmesidir ve mevcut tekniklerle, bir insanın aynı problem veya istem için alacağı sonuçları yaklaşık olarak tahmin etmek çok fazla bilgi işlem gücü gerektirir. Beyin, çağrışımları haritalamak için Wolff yasasını kullanır, bu burada “birlikte ateşlenen nöronlar birbirine bağlanır” anlamına gelir. Codex, işlediği veri kümeleri içindeki ilişkileri etiketleyen dahili bir ilişkisel veritabanı kullanır ve kelimenin tam anlamıyla 175 milyar kuralı vardır. Her ikisi de doğal dili koda çevirir. Beyin için çıkış aracı kortikal nöronlardır ve Codex için Python olabilir.
Geliştiren Bir Yapay Zeka Kendisi
Kendini tekrar tekrar geliştirmeyi öğrenebilen akıllı bir sistemden çok uzakta değiliz. Devlerin omuzlarında durursak, altımızda çok sayıda dev var ve hızla yükseliyoruz. Kurzweil, insan ilerlemesinin “hokey sopası” ile hızlanmasını tartışıyor ve yapay zekayı kolektif beceri ağacımızda bir sonraki doğal karmaşıklık düzeyi olarak konumlandırıyor.
Ben Codex the Singularity’i şaka olarak adlandırıyorum, ancak şaka bir yana, bu gerçekten AI’nın kendini geliştirebileceği kilit bir nokta gibi görünüyor. Codex’in yapabildikleri, tüm dünyayı, ilk sinapslarını kurarken yalnız bir nöronun ilk titremesi gibi arar. Diğer öğrenme sistemleriyle nerede ve nasıl eklemleneceğini göreceğiz.
Skynet zaman çizelgesinde, tüm kaçak AI antagonistinin yaratılması, Microsoft’un bugün Codex’e ve bazen Codex’e döktüğü düzeyde kaynaklar aldı. aynı satırı beş kez yazdırmak için mücadele ediyor. O düzeyde bir bilgi birikimine sahip olmadığımız açık. Bunun yerine Codex, Thieves of Fate’in büyük korelasyon motoru olan Toplayıcı’dan farklı değildir. İnsanların tekrarlayan görevlerden angaryayı otomatikleştirmesine yardımcı olan mekanik robotlar gibi, deneyimli programcılar için bir programlama eki olarak en kullanışlıdır. Bir işlemi kodla otomatikleştirmek için, istediğinizi elde edebilmeniz için, siz ve IDE’nin aynı sayfada olmasını sağlamak için çalışmanızı yeterince kesin olarak kısıtlamanız gerekir. Codex bu angaryanın bir kısmına yardımcı olabilir ve işte bu noktada parlıyor.
Böyle bir sistemin kendi başarıları üzerine inşa etmeyi öğrendiğini hayal etmek harika.
Çalışması için verdiğiniz şeye dayalı olarak çıktı döndürür. Codex, programcıların sıkıcı görevleri tamamlamasına ve tüm noktalı virgüllerin dahil edildiğinden emin olmasına yardımcı olabilir, ancak yine de mantıksal hatalara açıktır. Muhteşem ama kırılgan. Singularity için önceden genişletilmiş bir beta sürümü yapmamız daha iyi olabilir.
Şimdi Okuyun:
Yapay Zeka Destekli Elektronik Tasarım Otomasyon Araçları Çip Yapımını Yeniden TanımlayabilirGoogle, Daha İyi Yapay Zeka Donanım Hızlandırıcıları Oluşturmak için Yapay Zekayı DağıtıyorIBM Bir Yapay Zeka Özelliği Oluşturdu Bir Tartışmada İnsanlara Karşı Sahip Çıkma.