El AI Dreamer de Google aprende a hacer auto-hojas a través del tiempo dominando a Minecraft

Proceso de capacitación del soñador. Crédito: Naturaleza (2025). Doi: 10.1038/s41586-025-08744-2
Un trío de investigadores de inteligencia artificial de Google Google Deepmind, que trabaja con un colega de la Universidad de Toronto, informa que el Dreamer de algoritmo de IA puede aprender a mejorar a sí mismo al dominar a Minecraft en un corto período de tiempo. En su estudio publicado en la revista Nature, Danijar Hafner, Jurgis Pasukonis, Timothy Lillicrap y Jimmy Ba programaron la aplicación AI para jugar Minecraft sin ser entrenados y alcanzar un nivel de expertos en solo nueve días.
En los últimos años, los científicos informáticos han aprendido mucho sobre cómo se puede usar el aprendizaje profundo para capacitar a las aplicaciones de IA para realizar actividades aparentemente inteligentes, como responder preguntas. Los investigadores también han descubierto que las aplicaciones de IA pueden ser entrenadas para jugar y funcionar mejor que los humanos. Esa investigación se ha extendido al juego de videojuegos, lo que puede parecer redundante, porque ¿qué podrías obtener de una computadora jugando a otra computadora?
En este nuevo estudio, los investigadores encontraron que puede producir avances como ayudar a una aplicación de IA a aprender a mejorar sus habilidades durante un corto período de tiempo, lo que podría dar a los robots las herramientas que necesitan para realizar bien en el mundo real.
Crédito: Danijar Hafner et al., Https://danijar.com/project/dreamerv3/
En este esfuerzo, los investigadores programaron Dreamer para jugar el popular videojuego Minecraft construyendo un sistema de recompensas, específicamente recompensas para encontrar diamantes. Con este enfoque, la aplicación no necesitaba enseñarse cómo jugar el juego; Solo necesitaba conocer los parámetros dentro de los cuales podría funcionar, uno de los cuales incluía imaginar un mundo futuro virtual.
Una vez que el algoritmo aprendió a jugar a Minecraft, los investigadores agregaron un nuevo giro: solo permitieron que jugara bajo un escenario determinado durante 30 minutos a la vez. En ese momento, el juego se reiniciaría con un universo virtual completamente nuevo. Usando este enfoque, los investigadores encontraron que el algoritmo mejoró rápidamente, logrando el estado de expertos después de jugar el juego durante solo nueve días.
Diversos dominios visuales utilizados en los experimentos. Crédito: Naturaleza (2025). Doi: 10.1038/s41586-025-08744-2
El equipo de investigación sugiere que la capacidad del algoritmo de imaginar un futuro en el que se han logrado todos sus objetivos permitieron que se centre solo en aquellas tareas que condujeron al objetivo deseado y luego a usarlos en cada nuevo mundo virtual que encontró. Este resultado eventualmente podría usarse para ayudar a los robots a enseñar a sí mismos cómo lograr objetivos predefinidos en el mundo real.
Más información: Danijar Hafner, que domina diversas tareas de control a través de modelos mundiales, naturaleza (2025). Doi: 10.1038/s41586-025-08744-2. www.nature.com/articles/s41586-025-08744-2
Dreamerv3: danijar.com/project/dreamerv3/
© 2025 Science X Network
Cita: el AI Dreamer de Google aprende a mejorar con el tiempo al dominar Minecraft (2025, 4 de abril) Recuperado el 4 de abril de 2025 de https://techxplore.com/news/2025-04-google-ai-dreamer-Mastering-Minecraft.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.