
¿Podría el Veo 3 de Google marcar el inicio de modelos de mundo jugables?
Demis Hassabis, director ejecutivo de Google DeepMind, sugirió el martes por la noche que Veo 3, el nuevo modelo de generación de videos de Google, podría tener aplicaciones en el ámbito de los videojuegos.
Demis Hassabis, director ejecutivo de DeepMind, la organización de investigación en inteligencia artificial de Google, insinuó el martes por la noche que Veo 3, el último modelo de generación de video de Google, podría ser utilizado en el ámbito de los videojuegos. Esto surgió como respuesta a un mensaje en X que pedía a Google que permitiera jugar un videojuego con los videos generados por Veo 3 y preguntando sobre la disponibilidad de "modelos de mundos jugables". Hassabis comentó que "eso sería algo interesante".
Al día siguiente, Logan Kilpatrick, líder de producto para Google AI Studio y Gemini API, también respondió con un emoji que guardaba silencio. Sin embargo, las declaraciones de ambos ejecutivos parecen ser más una broma que una afirmación seria, y un portavoz de Google comunicó que no hay novedades por el momento. A pesar de ello, el desarrollo de modelos de mundos jugables no es una idea descabellada para la empresa.
Los modelos de mundos se diferencian de los modelos de generación de video, ya que los primeros simulan la dinámica de un entorno real, permitiendo que los agentes predigan cómo se desarrollará dicho entorno en respuesta a sus acciones, mientras que los modelos de video crean secuencias visuales realistas. Google tiene planes para transformar su modelo multimodal, Gemini 2.5 Pro, en un modelo de mundo que imite aspectos del cerebro humano.
En diciembre, DeepMind presentó Genie 2, un modelo capaz de generar una variedad “infinita” de mundos jugables. Al mes siguiente, se informó que Google estaba formando un nuevo equipo para desarrollar modelos de inteligencia artificial que puedan simular la realidad. Otros, como la pionera en IA Fei-Fei Li, también están trabajando en modelos de mundos; Li lanzó el año pasado su startup World Labs, que ha creado su propio sistema de IA para generar escenas en 3D similares a videojuegos a partir de una sola imagen.
Veo 3, que todavía se encuentra en vista pública, puede generar tanto video como audio para acompañar los clips, incluyendo desde discursos hasta bandas sonoras. Aunque Veo 3 crea movimientos realistas al simular la física del mundo real, aún no es un modelo de mundo. Podría ser útil para la narración cinematográfica en juegos, como escenas intermedias, tráilers y prototipos narrativos.
Este modelo sigue siendo una herramienta de salida "pasiva" y, para que futuras versiones de Veo puedan involucrarse en simulaciones más activas, interactivas y predictivas, tendrían que evolucionar. No obstante, el verdadero desafío en la producción de videojuegos no radica solamente en contar con gráficos impresionantes; se necesita una simulación en tiempo real, consistente y controlable. Por ello, podría ser razonable que Google adoptara un enfoque híbrido que combine Veo y Genie en el futuro, si decide aventurarse en el desarrollo de videojuegos o mundos jugables.
Google podría enfrentarse a competidores como Microsoft, Scenario, Runway, Pika y, eventualmente, el modelo de generación de video Sora de OpenAI. Dadas las intenciones de Google en el desarrollo de modelos de mundos y su capacidad consolidada para superar a sus rivales, sería prudente que las empresas competidoras mantuvieran una vigilancia cercana sobre sus movimientos.