
Comparé diferentes inteligencias artificiales con el mismo video y una superó con creces a las demás.
La inteligencia artificial está progresando rápidamente y la mayoría de los asistentes de IA pueden crear imágenes, funcionar como chatbots o realizar investigaciones en profundidad. No obstante, muchos de estos asistentes ahora permiten la generación de videos, ya sea a través de la propia IA o mediante un software complementario. Con tantas opciones disponibles...
El avance de la inteligencia artificial está sucediendo a un ritmo acelerado, permitiendo a la mayoría de las herramientas de IA generar imágenes, funcionar como chatbots o realizar investigaciones profundas. Recientemente, varias de estas herramientas han comenzado a ofrecer la capacidad de generar videos, ya sea de forma directa o a través de software complementario. Para explorar las opciones más populares en la generación de videos con IA, se realizó una prueba donde se utilizó el mismo prompt para cada herramienta con el fin de determinar cuál producía el mejor resultado.
Entre las herramientas evaluadas, se incluyó Sora, que es la responsable de la generación de videos en Microsoft Copilot y desarrollada por OpenAI, así como Grok y Google Gemini. Todos los softwares de inteligencia artificial recibieron la misma solicitud para crear un video con la presencia de humanos, incluyendo elementos de primer plano y fondo, buscando una profundidad de campo. La solicitud específica fue: "Crea un video de un hombre usando una laptop en un entorno de oficina, donde hay personas detrás de él. Luego mira a la cámara y le saluda con una sonrisa. El ambiente es tenso al principio, pero se vuelve más relajado al sonreír."
Los resultados, clasificados por su desempeño, son los siguientes:
-
Veo 3 (Google Gemini): Para generar un video con Google Gemini, es necesario acceder a Veo 3, que requiere un pago, aunque ofrece un mes de prueba gratuita. El video producido por Veo 3 se destacó por su alta calidad, con un fondo desenfocado y el sujeto perfectamente en enfoque. Capturó acertadamente la atmósfera y la descripción del prompt, mostrando al hombre inicialmente tenso y luego sonriente, con un saludo realista sin ningún tipo de errores o "alucinaciones". Este clip podría ser confundido con un material de marketing, llevando a Veo 3 a posicionarse como la mejor opción en esta prueba.
-
Grok: Esta herramienta es la única opción gratuita en la generación de videos, aunque se necesita crear una cuenta. El video generado por Grok cumplió bien con el prompt, incluyendo un entorno de oficina coherente y el sujeto mirando a la cámara y saludando. Sin embargo, se notó un breve fallo visual en los dedos, y la apariencia general era claramente artificial debido a un filtro suavizante. A pesar de estas imperfecciones, resultó ser una opción competente, superando a Sora en la adherencia al prompt aunque con un resultado menos impresionante.
-
Sora (ChatGPT y Microsoft Copilot): Aunque esta herramienta ofrece resultados visuales de alta calidad, se mostró decepcionante en comparación con las expectativas del prompt. Mientras que la calidad del video era buena y el fondo estaba desenfocado apropiadamente, el sujeto no actuó conforme a la solicitud inicial, lo que significó que no cumplió con lo que se esperaba, arrastrando así su valoración.
En resumen, mientras que Veo 3 sobresalió con un video de alta calidad que cumplió con el prompt de manera completa, Grok presentó una alternativa gratuita a pesar de sus limitaciones. Sora, aunque prometedora, no alcanzó el nivel de aceptación esperado debido a la falta de alineación con la solicitud.