Cover Image for Creative Commons lanza CC Signals, un marco para un ecosistema de inteligencia artificial abierto.

Creative Commons lanza CC Signals, un marco para un ecosistema de inteligencia artificial abierto.

La propuesta busca lograr un equilibrio entre la naturaleza abierta de internet y la creciente necesidad de datos para impulsar la inteligencia artificial.

Creative Commons, una organización sin fines de lucro promotora de un movimiento de licencias que permite a los creadores compartir sus obras mientras mantienen los derechos de autor, está preparándose para la era de la inteligencia artificial. Recientemente, la organización anunció el lanzamiento de un nuevo proyecto denominado CC signals, que permitirá a los titulares de conjuntos de datos especificar cómo su contenido puede o no ser reutilizado por máquinas, especialmente para el entrenamiento de modelos de IA.

Este proyecto busca encontrar un equilibrio entre la naturaleza abierta de internet y la creciente necesidad de datos para alimentar la inteligencia artificial. Según Creative Commons, la extracción continua de datos podría amenazar la apertura en línea, llevando a las entidades a cerrar sus sitios o protegerlos con muros de pago, en lugar de compartir sus datos de manera accesible.

El objetivo de CC signals es ofrecer una solución legal y técnica que facilite el intercambio de datos entre quienes los controlan y aquellos que los utilizan para entrenar modelos de IA. El interés por herramientas como esta está en aumento, ya que muchas empresas están adaptando sus políticas y términos de servicio para restringir el uso de sus datos en entrenamiento de IA o para aclarar cómo utilizarán los datos de los usuarios para fines relacionados con la inteligencia artificial.

Por ejemplo, X alteró inicialmente su política para permitir que terceros entrenaran modelos con su información pública, pero luego dio marcha atrás. Reddit, por su parte, está utilizando su archivo robots.txt para limitar el acceso a su información por parte de bots que intentan raspar datos para entrenar IA. Cloudflare está buscando implementar una solución que cobre a los bots de IA por el raspado de datos, así como herramientas para confundirlos. Desarrolladores de código abierto han creado herramientas para ralentizar a los rastreadores de IA que no respetan las directrices de "no raspar".

En contraposición, el proyecto CC signals sugiere un enfoque diferente: una serie de herramientas que ofrecen un rango de aplicabilidad legal, todas con un peso ético similar al de las licencias de CC que actualmente abarcan miles de millones de obras creativas licenciadas abiertamente en línea. Anna Tumadóttir, CEO de Creative Commons, expresó: “Los CC signals están diseñados para preservar el bien común en la era de la IA. Así como las licencias de CC ayudaron a construir la web abierta, creemos que los CC signals contribuirán a dar forma a un ecosistema de IA abierto basado en la reciprocidad”.

El proyecto está empezando a tomar forma, habiéndose publicado los primeros diseños en el sitio web y la página de GitHub de CC. La organización está buscando activamente comentarios del público antes de su plan de lanzamiento alfa (una prueba inicial) en noviembre de 2025, y además, llevará a cabo una serie de encuentros locales para recibir preguntas y opiniones.