Google presentó este martes Genie 3, la nueva versión de su modelo de inteligencia artificial capaz de generar entornos tridimensionales interactivos en tiempo real, similar a los de un videojuego. La herramienta fue desarrollada por DeepMind, y representa un avance significativo en el desarrollo de los llamados modelos de mundo.
Este tipo de sistemas utiliza IA para simular escenarios virtuales con múltiples propósitos: desde videojuegos y educación hasta el entrenamiento de agentes robóticos. En lugar de utilizar gráficos prearmados, los entornos se crean a partir de un simple prompt textual. Con Genie 3, los usuarios no solo podrán crear mundos personalizados, sino que también podrán interactuar durante varios minutos, algo que antes estaba limitado a segundos.
En comparación con su predecesor, Genie 2, lanzado en diciembre, las mejoras son notorias. Aquel modelo permitía entornos que duraban apenas entre 10 y 20 segundos. Ahora, según el blog oficial de Google, Genie 3 extiende la experiencia a “unos pocos minutos” de interacción continua, con la posibilidad de recordar detalles del entorno por al menos un minuto.
Esto implica que si un usuario se aleja de una pared con un grafiti, al volver a mirarla encontrará los mismos trazos y colores en el mismo lugar. En otras palabras, la IA no reescribe el mundo constantemente, sino que empieza a construir una especie de “memoria visual”.
Además, la calidad gráfica se ha elevado: los mundos generados por Genie 3 corren a una resolución de 720p a 24 cuadros por segundo. Aunque todavía lejos de los estándares de los motores de juego profesionales, representa un gran paso para la IA generativa.
Otro de los avances introducidos es lo que DeepMind denomina “eventos de mundo activables por texto” (promptable world events). Esto significa que se puede modificar dinámicamente el clima del entorno o añadir personajes con solo escribirlo en el prompt, ofreciendo así mayor versatilidad para la simulación o la narrativa interactiva.
Google ha invertido fuertemente en este campo emergente. La compañía formó un equipo especializado en world models, liderado por un ex codirector de Sora, la herramienta de generación de video de OpenAI.
No obstante, la tecnología aún tiene desafíos. El periodista Jay Peters, de The Verge, comentó que en pruebas recientes con otros modelos interactivos, como uno respaldado por un cofundador de Pixar, la experiencia se sintió “como caminar por una versión borrosa de Google Street View”, con objetos que cambiaban inesperadamente al girar la cámara.
Pese a eso, Genie 3 se perfila como un avance clave en el cruce entre IA generativa, videojuegos y simulación inmersiva. Si bien todavía no sustituye a los motores gráficos tradicionales, podría convertirse en una herramienta poderosa para desarrolladores, educadores o investigadores que busquen crear mundos sintéticos sin necesidad de modelado 3D manual.
Acerca de los comentarios
Hemos reformulado nuestra manera de mostrar comentarios, agregando tecnología de forma de que cada lector pueda decidir qué comentarios se le mostrarán en base a la valoración que tengan estos por parte de la comunidad. AMPLIAREsto es para poder mejorar el intercambio entre los usuarios y que sea un lugar que respete las normas de convivencia.
A su vez, habilitamos la casilla [email protected], para que los lectores puedan reportar comentarios que consideren fuera de lugar y que rompan las normas de convivencia.
Si querés leerlo hacé clic aquí[+]