Libro digital y en papel (recurso)

Libro digital y en papel (recurso) Ricardo Rubio Europa Press

Business

La IA enfrenta a la industria del libro por los derechos de autor

El Parlamento Europeo respalda la necesidad de una regulación más concreta sobre el uso de obras protegidas en el entrenamiento de modelos de inteligencia artificial, tras la reciente aprobación de un informe sobre el asunto

Contenido relacionado: Luis Ignacio, experto en propiedad industrial: "En el Mobile, los infractores son retirados en horas”

Llegir en Català
Publicada
Actualizada

Sant Jordi concentra cada año un fuerte pulso comercial que refuerza el protagonismo del sector editorial, con firmas, colas y novedades que mantienen al libro en el centro de la escena. Pero el auge de la inteligencia artificial (IA), cada vez más extendida, introduce un nuevo frente de debate: el uso de libros para entrenar modelos de esta tecnología.

El Centro Español de Derechos Reprográficos (Cedro) ya lo ponía sobre la mesa el pasado julio, al alertar de que cerca de 50.000 libros, de unos 41.000 autores españoles, podrían haberse utilizado sin permiso para desarrollar modelos de IA.

Afectados

La alerta partía del informe de la asociación danesa Rights Alliance, que apuntaba a grandes tecnológicas por extraer contenidos protegidos desde webs piratas, como Library Genesis (LibGen).

Entre los potenciales afectados, se encontraban nombres como Arturo Pérez-Reverte, María Dueñas, Almudena Grandes, Fernando Aramburu o Eduardo Mendoza, así como las editoriales Planeta,Anagrama y Acantilado.

Postura

El sector del libro señala que el problema viene de un marco legal "insuficiente" y de años de inacción institucional, lo que ha debilitado la protección de los derechos de autor.

De hecho, el director general de Cedro, Jorge Corrales, recuerda a que la situación viene de antaño. "Un libro se lee, pero también se fotocopia, se escanea y luego se imprime, y se envía a alumnos, familiares, amigos...El reconocimiento de los derechos de escritores, traductores y editores en las reutilizaciones de las obras editoriales ha sufrido de una situación de claro conflicto de intereses", sostiene.

En la misma línea, la Federación de Gremios de Editores de España ha denunciado reiteradamente que el sector lleva tiempo sufriendo un uso indebido de sus contenidos y que el impacto de la IA es especialmente grave dentro de los cambios tecnológicos recientes.

Detección

Por otro lado, Corrales explica cómo los autores pueden detectar si sus obras han sido “capturadas” para estos usos, a través de un proceso cada vez más estructurado.

La primera vía es poner a prueba a los propios sistemas: a través de prompts los investigadores pueden rastrear indicios del uso de ciertos contenidos. La segunda se adentra en un terreno mucho más técnico, basado en la reconstrucción de la información a partir de los parámetros y pesos internos de los modelos de lenguaje.

La tercera estrategia es más documental y se centra en el seguimiento de publicaciones de centros de investigación. Así ocurrió con el modelo MarIA, desarrollado por el Barcelona Supercomputing Center (BSC) dentro de un proyecto impulsado por el Ministerio de Transformación Digital, recuerda el director.

Normativa

En cualquier caso, el marco legal actual presenta ciertas limitaciones, por lo que no es posible afirmar que el entrenamiento de la IA generativa sea ilegal en Europa.

Violeta Arnaiz, directora de Propiedad Intelectual, IA y Software en Pons IP, explica que, en principio, cualquier reproducción de una obra protegida requiere de la autorización del autor y que el entrenamiento de la IA implica, en la práctica, hacer “copias” de los materiales utilizados.

Excepción legal

Existe, no obstante, una excepción importante en la normativa europea: la minería de textos y datos (TDM, por sus siglas en inglés), que permite utilizar y reproducir contenidos protegidos cuando el objetivo es analizar grandes volúmenes de información para identificar patrones o correlaciones.

"Aunque esta excepción es previa al auge y popularización de la IA y no estaba inicialmente pensándose en ello, lo cierto es que los actos de entrenamiento de modelos de IA encajan en la definición", explica Arnaiz.

Fachada de la Lliberia Sant Jordi (recurso)

Fachada de la Lliberia Sant Jordi (recurso) JOAN COLÁS

Exclusión

Ahora bien, cuando el uso tiene otra finalidad, como el entrenamiento de modelos de lenguaje (LLMs), puede hacerse sin autorización siempre que los autores no hayan reservado expresamente su oposición.

"El problema es la indefinición acerca de la forma en que ha de formularse esa reserva, además, claro, de los usos hechos con anterioridad, ya que antes de 2022 la IA aún no era conocida por el gran público y este mecanismo de reserva de derechos prácticamente no se utilizaba", agrega la experta en propiedad industrial.

Protección de obras

La protección de las obras pasa por la reserva de derechos, que obliga a obtener licencia para su uso, y puede reforzarse con herramientas tecnológicas que dificulten el web scraping, es decir, la extracción automatizada de datos de sitios web mediante bots.

En la Unión Europea también se estudia canalizar la gestión de licencias y su remuneración a través de entidades colectivas, recuerda Arnaiz.

Transparencia

Conviene tener en cuenta que los grandes modelos de lenguaje se desarrollan sobre todo en Estados Unidos y operan bajo una normativa distinta a la europea.

Aun así, el reglamento europeo de IA ya avanza exigencias de transparencia, incluida la obligación de documentar sus fuentes de entrenamiento.

Contexto

En 2024, Bruselas dio luz verde a su primera gran regulación sobre IA, cuyo despliegue avanza de forma progresiva desde el año pasado. Sin embargo, la propia Comisión Europea ha reconocido las dificultades de aplicación, por lo que ha dejado abierta la posibilidad de retrasar los plazos, si las empresas no llegan a tiempo para cumplir con sus obligaciones.

En paralelo a esto, en España, el Ministerio de Cultura retiró a comienzos de 2025 la tramitación de un decreto que buscaba regular las licencias de uso de IA, tras no alcanzarse un consenso entre los distintos actores implicados.

'Informe Voss'

En este contexto, el debate se ha ido desplazando hacia nuevas propuestas. El mes pasado el Parlamento Europeo aprobó --con amplia mayoría-- el informe sobre derechos de autor e IA generativa (el denominado coloquialmente 'Informe Voss'). Pese a que no tiene carácter vinculante, sí marca una línea política clara en Bruselas, al plantear la necesidad de una regulación más específica sobre esta cuestión.

Su propuesta es crear un sistema europeo de licencias basado en acuerdos colectivos por sectores, gestionados a través de entidades de derechos y la EUIPO (Oficina de Propiedad Intelectual de la Unión Europea).

El documento busca un equilibrio entre proteger a los autores con una compensación por el uso de sus obras en el entrenamiento de la IA y, a la vez, ofrecer a las empresas tecnológicas una vía legal y estructurada para acceder a grandes volúmenes de información.