Bu algoritmayı Atari’nin Tuzağı’nı oynamak için koydular ve öncekiler tek bir noktaya değinemese de, zaten insanları iyileştiriyor.
Bir algoritma karmaşık ortamları keşfedebilir mi yoksa bunun yerine hepsini çiğnemeniz mi gerekiyor? Yani, karmaşık ortamları keşfederek ve anlayarak kararlar almak ve ödülleri en iyi şekilde nasıl elde edeceğini öğrenmek için yapay zeka sistemlerini eğitebilir miyiz? Adrien Ecoffet, Joost Huizinga ve meslektaşlarının yanıtlamak için yıllarını harcadıkları soru budur ve bu gerçekten de karmaşık bir sorudur.
Neyse ki, video oyunlarımız var.
Algoritmalar ve video oyunları
{«file»:»https://webediaespana.video.content-hub.app/default/video/13/f3/d2/6012a48a3bef075124/default-standard-180.mp4″,»image»:»https:// webediaespana.delivery.content-hub.app/image/4d/b4/05/6012a4854bd22f5584/original/spider-man-atari-2600-trailer.jpeg»}
Ve mesele şu ki, bir an için düşünürsek, video oyunları bu tür kararlarda yapay zekaları eğitmek için harika bir çerçeve (ve hangi metodolojinin en iyi sonucu verdiğini test etmek için): art arda daha karmaşık ortamlarda öğrenmeniz gereken her şeye sahipler, belirli bir konuma ulaşmaya veya bir video oyununda bir seviyeyi tamamlamaya dayalı ödüller belirlemenize izin veriyorlar ve aslında, onlar yeni başlayanlar için bile bir meydan okuma oluşturur.
Ecoffet ve ekibi, pekiştirmeli öğrenme algoritmalarıyla çalışıyor ve yeni yaklaşımlarını klasik Atari video oyunlarıyla test etmeye karar verdiler. Özellikle, ‘Montezuma’nın İntikamı’ ve ‘Tuzak’. Bu sadece bir nostalji nöbeti değil, bu Atari 2600 oyunları bu tür sistemler için ‘altın standart’ haline geldi. Şimdiye kadar daha ileri gitmeden, algoritmalar ilkinde mütevazı puanlar elde etti ve ikincisinde sefil bir şekilde başarısız oldu: tek bir puan alamadılar.
Ecoffet ekibi (Go-Explore olarak adlandırılır) tarafından geliştirilen algoritma ailesi, Nature dergisinde yeni yayınlandığı gibi konuyu değiştiriyor. Fikir, GO-Explore’un ortamları derinlemesine keşfedin ve hatırlamalarına yardımcı olacak bir dosya oluşturun umut verici bir ara aşamaya veya başarılı bir sonuca giden yolu unutmamaya dikkat ederek.
{«file»:»https://webediaespana.video.content-hub.app/default/video/38/3c/c2/6021add74bd22fc588/default-standard-180.mp4″,»image»:»https:// webediaespana.delivery.content-hub.app/image/14/df/23/6021ad993bef074aee/orijinal/que-es-la-inteligencia-artificial-captcha-1×01.jpeg»}
Ve bu araçlarla, Go-Explore algoritmaları ‘Montezuma’nın İntikamı’nda önceki puanları dört katına çıkardı ve ‘Pitfall’da Ortalama İnsan Performansını Aştı (dediğim gibi, önceki algoritmalar herhangi bir puan alamadı).
Bu başarının ardından ve yine ‘Doğa’ verilerine göre araştırmacılar, aynı algoritmaları, nesneleri robotik bir kolla (kilitli kapıların arkasındaki izole konumlarda) toplama ve yerleştirmeyi simüle eden robotik görevlere uyguladılar. Ve bu iyi bir haber çünkü Bir AI’nın Fornite’ta bizi yenmesi için hala çok şey var1982’deki oyunlarda yapmaları gerçeği, yakında yapacaklarının (ve ilginç pratik uygulamalarının olduğunun) bir işaretidir.
resim | Atari – Vijoy Rao
– Haberler Bu algoritmayı Atari’nin Tuzağı’nı oynamak için koydular ve öncekiler tek bir noktaya değinemese de, zaten insanları iyileştiriyor. aslen yayınlandı Xataka Javier Jimenez tarafından.
Orijinal kaynağı kontrol edin
Bunu severim:
Yükleniyor…