Cover Image for La IA que gritó ¡AAAAAHHH!

La IA que gritó ¡AAAAAHHH!

Conoce un modelo de voz de inteligencia artificial que posee un amplio rango emocional y un toque dramático.

Un nuevo modelo de inteligencia artificial llamado Dia ha sido desarrollado por Nari Labs, un pequeño equipo que ha decidido explorar una dimensión emocional en las voces sintéticas. A diferencia de las voces AI que buscan ser amigables y realistas, Dia incluye una gama de expresiones que abarcan desde risas y tos hasta gritos intensos.

La capacidad de simular gritos es un desafío en el ámbito de la inteligencia artificial, ya que va más allá de simplemente hablar en voz alta. El verdadero grito implica un modo de expresión completamente diferente, lo que representa una brecha en la mayoría de los modelos de voz actuales. Mientras que muchos sistemas AI pueden narrar un cuento para dormir sin dificultad, se enfrentan a dificultades al intentar transmitir emociones como calmar a un amigo o mostrar sorpresa ante algo impactante. Generalmente, los modelos comerciales tienden a suavizar el tono para evitar sonar robóticos, lo que limita su capacidad de manifestar emociones de manera auténtica.

Dia, por su parte, integra la comunicación no verbal en su interpretación, reconociendo que un "(tos)" no puede ser ignorado y que un grito implica una variación significativa en la entrega. Su diseño incluye un control preciso del tiempo, la modulación del tono y la respiración, lo que confiere a estas expresiones una mayor autenticidad.

Un usuario creativo incluso utilizó Dia para recrear una escena del célebre sketch de Leroy Jenkins en World of Warcraft. Aunque otros modelos de voz de OpenAI, ElevenLabs y Google son muy buenos, y permiten personalizar la emotividad en su discurso, no alcanzan la capacidad de Dia para replicar sorpresas o reacciones genuinas como una risa ahogada.

Lo realmente notable de Dia va más allá de ser un simple “truco” de voz AI; representa un avance en la búsqueda de la inteligencia emocional en la tecnología. Nos adentramos en una etapa en la que los asistentes virtuales no solo deben comunicar el mensaje correcto, sino también hacerlo de una manera que refleje la emoción adecuada. Esto es particularmente relevante en el ámbito del soporte al cliente, donde es crucial que la respuesta suene genuina o en el ámbito educativo, donde se espera que los maestros suenen motivadores.

No obstante, otorgar a las IA la capacidad de expresar emociones de manera convincente podría traer consigo riesgos de manipulación, ya que estas herramientas se vuelven más persuasivas. Así, el uso de un discurso emocional podría tener implicaciones más amplias sobre la percepción y la reacción del público.

Aún así, la posibilidad de crear narraciones, como una historia de fantasmas, y ver a Dia no solo leerla, sino performarla con gritos y otras emociones, promete ser una experiencia divertida y única.