Cover Image for Una herramienta de inteligencia artificial de Meta, Llama, ha memorizado casi por completo el libro de Harry Potter, según un estudio.

Una herramienta de inteligencia artificial de Meta, Llama, ha memorizado casi por completo el libro de Harry Potter, según un estudio.

Llama enfrenta un problema de memoria, pero no lo consideres como una prueba concluyente.

Meta ha desarrollado el modelo Llama, que ha demostrado tener la capacidad de memorizar obras literarias. Un análisis reciente reveló que puede reproducir fragmentos verbatim de “Harry Potter y la piedra filosofal” en un 42% de los casos. Este estudio, llevado a cabo por académicos de Stanford, Cornell y la Universidad de West Virginia, se basa en el polémico conjunto de datos Books3, que incluye libros piratas y es clave en una demanda por infracción de derechos de autor contra Meta.

El documento de investigación menciona que el modelo Llama 3.1 tiene una capacidad de memorización notable, incluso llegando a recordar casi por completo “Harry Potter” y “1984”. Sin embargo, la capacidad de reproducción varía según el libro y el modelo. Por ejemplo, el estudio indica que Llama 3.1 solo memoriza el 0.13% de "Sandman Slim", la obra de Richard Kadrey, uno de los demandantes en la acción colectiva contra Meta.

A pesar de que algunos resultados del estudio pueden parecer perjudiciales para Meta, expertos como Timothy B. Lee sugieren que estos hallazgos no constituyen evidencia concluyente en los casos de infracción de derechos de autor contra compañías de IA. Lee menciona que estos resultados diversos podrían generar dudas sobre la validez de agrupar a varios autores en una demanda masiva, lo que podría beneficiar a Meta, dado que muchos escritores no tienen los recursos para emprender acciones legales individuales.

La capacidad de Llama para reproducir ciertas obras más que otras ha sido objeto de especulación. James Grimmelmann, profesor de derecho digital e información, apunta que la notoriedad de “Harry Potter” posiblemente ha permitido que extensos fragmentos de la obra estén presentes en datos utilizados para el entrenamiento del modelo. Esto sugiere que las empresas de IA pueden influir en sus opciones para aumentar o disminuir la memorización, indicando que no es una característica inevitable.

Los argumentos de Meta sobre el uso de obras con derechos de autor en el entrenamiento de sus modelos suelen basarse en la doctrina del "uso justo", aunque el nivel de memorización podría complicar esta defensa. Robert Brauneis, profesor de la Facultad de Derecho de la Universidad George Washington, considera que la creciente evidencia de memorización en modelos de lenguaje cambiará la forma en que se analiza la propiedad intelectual.

Se solicitó un comentario a Meta sobre los hallazgos del estudio, y se dará seguimiento a este artículo en caso de recibir una respuesta.