
Esta inteligencia artificial transforma video en tiempo real.
Una nueva empresa llamada Decart ha creado un modelo de inteligencia artificial capaz de transformar imágenes en tiempo real. Los resultados son sorprendentes y tienen el potencial de revolucionar el mundo del streaming.
Dean Leitersdorf se presenta a través de Zoom y, tras una breve charla, teclea un mensaje que provoca una sensación de alucinación: “salvaje oeste, cósmico, Imperio Romano, dorado, bajo el agua”. Con estas palabras, alimenta un modelo de inteligencia artificial creado por su startup, Decart, que manipula video en vivo en tiempo real. “No tengo idea de lo que va a suceder,” dice Leitersdorf riendo, justo antes de transformarse en una versión extraña y dorada de Julio César, vestido con un poncho.
Con una apariencia un tanto salvaje, su largo cabello cae sobre su espalda mientras juega con un bolígrafo que salta entre sus dedos. Durante la conversación, su imagen en pantalla oscila de maneras surrealistas mientras el modelo intenta predecir el aspecto de cada nuevo fotograma. Cuando cubre su rostro, su imagen se altera con características más femeninas y el bolígrafo cambia de colores y formas. Agrega más conceptos que lo llevan a nuevos reinos alucinantes.
El modelo de video a video de Decart, conocido como Mirage, representa un impresionante logro tecnológico y una señal de cómo la inteligencia artificial podría revolucionar la industria del livestreaming. Herramientas como Sora de OpenAI pueden generar imágenes de video cada vez más realistas basándose en un texto. Ahora, Mirage permite manipular videos en tiempo real.
El jueves, Decart lanzará un sitio web y una aplicación que permitirá a los usuarios crear sus propios videos y modificar clips de YouTube. El sitio ofrecerá varias temáticas predeterminadas, que incluyen “anime”, “vista del horizonte de Dubái”, “cyberpunk” y "Palacio de Versalles”. Durante la entrevista, Leitersdorf sube un clip de alguien jugando Fortnite y la escena se transforma de un mundo familiar de Battle Royale a una versión bajo el agua.
La tecnología de Decart tiene un gran potencial en el ámbito de los videojuegos. En noviembre de 2024, la compañía presentó un juego llamado Oasis que utilizaba un enfoque similar al de Mirage para generar un mundo jugable estilo Minecraft en tiempo real. Los usuarios podían acercarse a una textura y luego alejarse para producir nuevas escenas jugables dentro del juego.
Manipular escenas en vivo en tiempo real es una tarea computacionalmente exigente. Decart ha desarrollado un código de bajo nivel para maximizar la velocidad de cálculo en chips de Nvidia y lograr este impacto. Mirage genera 20 fotogramas por segundo a una resolución de 768 × 432 y una latencia de 100 milisegundos por fotograma, lo que es suficiente para producir un clip de calidad adecuada para TikTok.
La creación de video en tiempo real también presenta desafíos porque un modelo puede desviarse de la realidad de formas extremas. Decart ha creado un esquema personalizado para entrenar y ejecutar un modelo que logra mayor coherencia. Además, la empresa ha ideado una forma para que su modelo corrija errores rápidamente.
Decart afirma estar trabajando hacia la salida en Full HD y 4K, además de buscar nuevas formas para que los usuarios controlen sus videos. “Tenemos muchas más novedades en camino que permitirán realizar ediciones más específicas,” expresa Leitersdorf.
Es fácil imaginar que esta herramienta se vuelva popular en plataformas como TikTok o Instagram; claramente disfruté creando escenas peculiares con amigos, generando una amplia gama de personajes de estética cyberpunk, algunos con un número improbable de dedos. Sin embargo, su imprevisibilidad puede resultar controvertida, ya que a veces el modelo parece insistir inexplicablemente en cambiar la raza de un usuario.
Leitersdorf señala que, fuera de su propia empresa, solo los grandes laboratorios de inteligencia artificial—como OpenAI, Anthropic, xAI, Google y Meta—tienen la capacidad técnica para crear algo como Mirage. Sin embargo, no tiene intención de ser adquirido. “Tenemos cinco años para intentar construir un kilo-unicornio,” comenta, jugando con su bolígrafo. “Eso son 1,000 millones de dólares, o un billón de usuarios.”