En agosto de 2025, Google DeepMind presentó Genie 3, un modelo de inteligencia artificial que marca un punto de inflexión en la generación de contenidos digitales. A diferencia de las IA que producen vídeos breves o imágenes estáticas, Genie 3 es capaz de crear mundos 3D completamente interactivos en tiempo real a partir de una simple descripción por texto —o incluso de una imagen—.
No se trata de una animación pregrabada. Genie 3 construye una simulación dinámica y persistente, un entorno virtual en el que el usuario puede moverse libremente, interactuar con objetos y observar cómo el mundo reacciona a sus acciones, de forma muy similar a un videojuego.
Mundos que no desaparecen al mirar a otro lado
Uno de los aspectos más llamativos de Genie 3 es su coherencia temporal. Los escenarios generados —bosques, océanos, desiertos o mundos imaginarios— mantienen su estructura aunque el usuario se aleje o cambie el punto de vista.
Si un objeto se mueve, cae o se desplaza, permanece en ese estado cuando el usuario regresa a la zona. Esto crea la sensación de estar dentro de un mundo “real”, no en una escena efímera generada por IA.
Esta persistencia no fue programada manualmente: emerge del propio entrenamiento del modelo, lo que indica que Genie 3 ha aprendido reglas básicas sobre espacio, causalidad y física.
¿Qué hace exactamente Genie 3?
Genie 3 convierte lenguaje natural en una experiencia jugable.
Si el usuario escribe, por ejemplo, “un bosque alienígena con gravedad baja”, la IA genera:
- Un entorno visual coherente con esa descripción
- Árboles y paisajes de aspecto no terrestre
- Un sistema físico adaptado, donde los saltos son más largos y los movimientos más ligeros
El mundo se genera a medida que el usuario se desplaza, calculando en tiempo real qué aparece alrededor y cómo responde el entorno. Si el usuario corre, vuela o choca con un objeto, la simulación reacciona con físicas plausibles: los objetos caen, rebotan, el agua salpica y los elementos interactúan entre sí de forma lógica.
Este enfoque convierte a Genie 3 en lo que se conoce como un “modelo de mundo”.
Un modelo de mundo, no solo un generador de imágenes
Las IA tradicionales de vídeo predicen fotogramas uno tras otro sin comprender realmente la escena. Genie 3 va más allá: simula el funcionamiento de un entorno completo.
El modelo aprende cómo evolucionan los mundos en el tiempo y cómo las acciones del usuario afectan a ese entorno. En la práctica, funciona como un motor de juego universal aprendido por experiencia, no como un simple generador visual.
Dicho de forma sencilla: Genie 3 permite escribir un mundo con palabras y luego entrar en él.
Capacidades técnicas clave
Generación en tiempo real
Genie 3 genera entornos 3D interactivos con calidad cercana al fotorrealismo a unos 20–24 fotogramas por segundo, con resolución HD (~720p). A diferencia de versiones anteriores, la experiencia puede mantenerse durante varios minutos de exploración continua, sin que el mundo pierda coherencia.
Persistencia y física consistente
El sistema incorpora una especie de memoria ambiental: los objetos y cambios realizados por el usuario permanecen durante la sesión. Huellas, desplazamientos o interacciones no se “resetean”, reforzando la sensación de un mundo estable y creíble.
Eventos modificables por texto
Durante la simulación, el usuario puede introducir nuevas instrucciones en lenguaje natural:
- “Empieza a llover”
- “Añade un dragón volando”
- “Convierte el terreno en nieve”
Los cambios se aplican al instante, sin reiniciar el entorno, lo que convierte a Genie 3 en una herramienta altamente flexible y controlable.
Aprendizaje a partir de vídeos reales
Genie 3 fue entrenado mediante aprendizaje autosupervisado con más de 30 millones de vídeos no etiquetados. Observando escenas del mundo real, la IA aprendió por sí misma regularidades físicas como la gravedad, las colisiones o el movimiento de los objetos, sin motores de físicas programados ni reglas explícitas.
¿Para qué sirve Genie 3?
Entrenamiento de IA y robótica
Los mundos simulados de Genie 3 permiten entrenar agentes de IA o robots en entornos complejos y realistas sin riesgos reales. Vehículos autónomos, sistemas de navegación o agentes inteligentes pueden “aprender jugando” antes de enfrentarse al mundo físico.
Videojuegos y experiencias inmersivas
Para la industria del gaming y la realidad virtual, Genie 3 abre la puerta a mundos generados bajo demanda. Un desarrollador podría describir un escenario en texto y obtener al instante un entorno jugable, acelerando enormemente el proceso creativo.
Educación y simulación
Desde recreaciones históricas interactivas hasta simuladores de formación profesional, Genie 3 puede generar experiencias educativas inmersivas donde el usuario no solo observa, sino que participa activamente.
¿Por qué Genie 3 es un avance clave?
Un paso hacia la inteligencia artificial general
DeepMind considera a Genie 3 un escalón importante hacia la AGI (inteligencia artificial general). Los modelos de mundo permiten que las IA aprendan razonando sobre experiencias simuladas, de forma más parecida a cómo aprenden los humanos.
Más allá del vídeo generado
Frente a modelos como Sora, que producen clips pasivos, Genie 3 crea mundos con lógica interna, persistentes y manipulables. No solo muestra imágenes: simula realidades completas.
Un nuevo paradigma para la IA generativa
Genie 3 no es simplemente una mejora visual. Representa un cambio de paradigma: la IA deja de generar contenidos estáticos para crear entornos vivos, donde el usuario puede explorar, modificar y aprender.
Si esta tecnología continúa evolucionando, podría redefinir cómo entendemos los videojuegos, la educación, la simulación y, en última instancia, la forma en que las inteligencias artificiales aprenden sobre el mundo.




