
Ahora puedes explorar mundos interactivos de IA creados por uno de los cofundadores de Pixar.
¿Un cambio hacia el "video interactivo"? Aún no.
Recientemente, diversas empresas dedicadas a la inteligencia artificial han estado explorando mundos interactivos generados por IA. Se han creado versiones de Quake y Minecraft impulsadas por inteligencia artificial, y Google DeepMind está formando un equipo para desarrollar modelos que simulan el mundo. En medio de estas innovaciones, una startup de IA respaldada por el cofundador de Pixar, Edwin Catmull, busca aportar su propia perspectiva al concepto con un proyecto denominado “video interactivo”, que está disponible para que el público lo conozca a través de una vista previa de investigación.
La startup, conocida como Odyssey, define el video interactivo en su sitio web como “video que puedes tanto ver como interactuar, imaginado completamente por IA en tiempo real.” La propuesta permite a los usuarios participar de alguna forma en el video, similar a un videojuego en primera persona, pero en entornos que parecen más reales en lugar de ser simples polígonos. Odyssey lo promociona como una “versión temprana del Holodeck”, aunque admite que la experiencia actual se asemeja más a explorar un sueño defectuoso: “crudo, inestable, pero indudablemente nuevo.”
Al experimentar los videos interactivos de Odyssey, la sensación es similar a caminar a través de una versión borrosa de Google Street View. Los usuarios pueden desplazarse por los mundos generados en tiempo real utilizando las teclas WASD, como si estuvieran en un juego. Hay varias localizaciones entre las que se puede alternar, como un área boscosa con una cabaña, un centro comercial y un aparcamiento frente a un gran edificio. Cada vez que se accede, el sistema regenerará la vista, aunque la calidad de la imagen suele ser algo borrosa.
Por el momento, se ofrece un tiempo limitado de dos minutos y medio para explorar la vista previa antes de que se detenga, aunque es posible recargar y volver a ingresar. Odyssey menciona que está utilizando clusters de GPUs H100 en Estados Unidos y Europa para crear estos videos interactivos. “Utilizando esa entrada y el historial de cuadros, el modelo genera lo que piensa que debería ser el siguiente cuadro, transmitiéndolo en tiempo real”, explica la empresa en su sitio, agregando que este proceso puede tardar “tan solo” 40 milisegundos.
La vista previa actual no está destinada a reemplazar juegos como Fortnite en el corto plazo. En varias ocasiones, los objetos solo colisionan de manera intermitente; en un momento me detuvo una valla, mientras que al tratar de atravesar una casa grande, me traspasé. En otro intento, bajé unas escaleras y vi cómo la puerta hacia la que me dirigía se convertía en una pared de ladrillos. Además, el sistema presenta comportamientos extraños cuando uno permanece inmóvil; en una ocasión, no toqué los controles y el modelo comenzó a girarme lentamente hacia la izquierda, acercándome a una pared.
En una entrevista, Catmull, quien forma parte de la junta de Odyssey, no pudo proporcionar un cronograma concreto sobre cuándo podría mejorar la calidad de la imagen. Sin embargo, mencionó que Odyssey está “a la vanguardia” en este ámbito y que “participan en esta comunidad más amplia, por lo que la información sobre cómo mejorar esto sigue evolucionando.” Aunque reconoció que las imágenes aún son confusas, afirmó que la mayor parte del ruido, como las texturas de un edificio, es precisamente el tipo de aspectos que se espera resolver aplicando filtros de redes neuronales.
A pesar de lo entretenidos que pueden ser sus fallos y problemas, no se puede considerar un gran videojuego en este momento. Tampoco parece que vaya a reemplazar al cine pronto; la forma en que el mundo cambia de maneras inesperadas resulta demasiado distraído, y saber que lo que se proyecta no se desvanece frente a ti es clave para una buena película. La fusión de estos dos medios aún no logra un resultado óptimo.
Sin embargo, al experimentar con la vista previa, se percibe un potencial interesante. Con la rapidez en la que están evolucionando las herramientas de IA, no sería descabellado imaginar una versión futura con muchas menos fallas. Aunque aún está lejos de ser un Holodeck, hay un largo camino por recorrer para alcanzar ese objetivo en el ámbito del video generado por IA.