OpenAI yapay zekaya (AI) ve insanlığa yarar sağlayan makine tahsili ilerlemelerine odaklanan bir şirket pozisyonunda. Son vakitlerde firma, 70.000 saatten fazla oyun görüntüsü kullanarak bir botu Minecraft oynamak için muvaffakiyetle eğittiğini duyurdu. Muvaffakiyet, oyun oynayan bir bottan çok daha fazlasını, müşahede ve taklit temelli makine tahsilinde ileriye hakikat atılmış büyük bir adıma işaret ediyor.
Yapay zeka eğitimi için kıymetli gelişme
OpenAI’ın geliştirmiş olduğu botu, taklit edilmiş öğrenme ya da kontrollü öğrenmenin harikaya yakın bir örneği pozisyonunda. Amaca ulaşıldığında ödüllendirme vadeden pekiştirmeleri öğrenmenin bilakis taklit edilmiş öğrenme, insanların makul vazifeleri yerine getirmesini izleyerek gerçekleştiriliyor. Bu iki öğrenme taktiği biz beşerler için de geçerli. Bu durumda OpenAI, botlarına, tipik bir oyuncunun başarması için yaklaşık 24.000 ferdî hareket gerektirecek karmaşık oyun içi atakları öğretmek için mevcut oyun görüntülerinden ve eğitimlerinden yararlandı.
OpenAI ise üstte bahsettiğimiz manuel data etiketleme süreçleriyle uğraşmak yerine mevcut etiketli görüntülerin sayısını artırmak için Görüntü Ön Eğitimi (VPT) olarak bilinen özel bir yaklaşım kullandı. Başlangıçta 2000 saatlik açıklamalı Minecraft oynanışıyla sistem eğitildi. Akabinde bu süreçte elde edilen bilgiler 70.000 saatlik daha evvel etiketlenmemiş Minecraft içeriğini etiketlemek için kullanıldı. Münasebetiyle bu süreç sonucunda Minecraft botuna incelemesi ve taklit etmesi için çok daha büyük bir data kümesi sağladı.