En los últimos años, la inteligencia artificial (IA) ha dejado de ser solo una promesa futurista para convertirse en una herramienta indispensable en nuestras vidas diarias. Desde asistentes virtuales hasta generadores de contenido, los modelos de IA están revolucionando la forma en que interactuamos con la tecnología. Pero con estos avances, también surgen preguntas importantes sobre cómo las grandes empresas tecnológicas están utilizando los datos para entrenar sus modelos.
A continuación, exploraremos todo lo que está pasando en este caso y cómo podría influir en el futuro de la regulación de la IA y la protección de los derechos de autor.
Tabla de contenidos
- Introducción: Meta en el ojo del huracán por el uso de datos no autorizados
- ¿Qué Son las “Shadow Libraries”?
- La demanda: ¿Qué alegan los autores?
- Evidencia: ¿Cuánto tiempo estuvo Meta usando estos datos?
- La respuesta de Meta: ¿Qué está diciendo la empresa?
- Implicaciones legales: Un caso que podría cambiar la regulación de la IA
- ¿Qué se está haciendo para resolver el conflicto?
- Conclusión: La necesidad de regular el uso de datos en la IA
Introducción: Meta en el ojo del huracán por el uso de datos no autorizados
Uno de los casos más recientes que está dando de qué hablar involucra a Meta Platforms, la empresa detrás de gigantes como Facebook, Instagram y WhatsApp. Meta está siendo demandada por varios autores de renombre que alegan que la compañía descargó y utilizó material protegido por derechos de autor para entrenar su modelo de inteligencia artificial Llama, sin su consentimiento. Este caso no solo pone en juego la legalidad de las prácticas de Meta, sino que también abre el debate sobre los límites éticos en el uso de material protegido y cómo se deben regular los datos en la era de la inteligencia artificial.
¿Qué Son las “Shadow Libraries”?

Las “shadow libraries” son plataformas en línea que permiten el acceso gratuito a una gran cantidad de libros, artículos y otros materiales, pero sin la autorización de los autores o editores. Aunque son populares entre quienes buscan acceder a contenido sin tener que pagar, estos sitios a menudo están en zonas grises legales, ya que distribuyen material protegido por derechos de autor sin compensar a los creadores.
Sitios como LibGen y Z-Library son los más conocidos de este tipo de bibliotecas. Aunque los usuarios pueden encontrar gran cantidad de libros de manera gratuita, la legalidad de estas plataformas está bajo constante debate, ya que distribuyen contenido sin la debida autorización de los propietarios de los derechos.
La demanda: ¿Qué alegan los autores?

En enero de 2025, varios autores de renombre, entre ellos Sarah Silverman, Ta-Nehisi Coates y Richard Kadrey, decidieron presentar una demanda contra Meta. En su demanda, alegan que la empresa descargó y utilizó sus libros sin permiso para alimentar los sistemas de inteligencia artificial de Meta, incluido el modelo Llama.
El caso se basa en el hecho de que Meta descargó masivamente contenido de LibGen y Z-Library, plataformas que ofrecen libros de manera gratuita pero que no cuentan con la autorización de los autores para distribuir sus obras. Los demandantes exigen compensación por el uso no autorizado de sus obras y argumentan que Meta no solo utilizó sus libros sin consentimiento, sino que tampoco les pagó por ello.
Evidencia: ¿Cuánto tiempo estuvo Meta usando estos datos?
Según los documentos presentados en la demanda, Meta descargó más de 81,7 terabytes de datos de LibGen y Z-Library entre 2021 y 2023, utilizando torrents para realizar la descarga. Lo que es aún más preocupante es que este proceso fue llevado a cabo de forma masiva y sistemática durante un periodo de más de dos años, lo que subraya la magnitud del uso de contenido sin licencia para entrenar los modelos de IA de Meta.
Los correos electrónicos internos de Meta, que fueron presentados como prueba en la demanda, revelan que la empresa era consciente de que este material estaba protegido por derechos de autor, pero decidió proceder con el uso de los datos a pesar de las advertencias de su equipo legal.
La respuesta de Meta: ¿Qué está diciendo la empresa?

Meta aún no ha emitido una declaración oficial sobre el caso, pero en ocasiones anteriores, la empresa ha defendido el uso de datos de acceso público para entrenar sus modelos de IA, bajo el argumento de que se basa en el principio de “uso justo” del derecho de autor. Esto significa que Meta considera que su uso de estos datos no infringe las leyes de derechos de autor, ya que los está utilizando para mejorar sus tecnologías, no para fines comerciales directos.
Sin embargo, la filtración de correos electrónicos internos y la acusación de que Mark Zuckerberg aprobó la utilización de libros piratas ha puesto a Meta en una posición incómoda, ya que la empresa podría enfrentar consecuencias legales importantes si el tribunal determina que violó las leyes de derechos de autor.
Implicaciones legales: Un caso que podría cambiar la regulación de la IA
Este caso tiene el potencial de marcar un hito en la industria tecnológica. Si el tribunal falla a favor de los demandantes, Meta podría enfrentarse a grandes sanciones económicas y ser obligada a modificar sus prácticas de recopilación de datos. Este litigio también podría redefinir la forma en que se utilizan los datos para entrenar modelos de IA, estableciendo nuevos precedentes legales que podrían afectar a todas las grandes empresas tecnológicas.
La resolución de este caso podría llevar a una mayor regulación sobre el uso de material protegido en el entrenamiento de modelos de inteligencia artificial, lo que forzaría a las empresas a encontrar formas más éticas y legales de recolectar los datos necesarios para mejorar sus tecnologías.
¿Qué se está haciendo para resolver el conflicto?

En cuanto a la resolución del conflicto, los abogados de Meta están trabajando en su defensa, argumentando que el uso de datos de LibGen y Z-Library es un uso transformador y que no constituye una infracción de derechos de autor. Sin embargo, varios grupos de autores y organizaciones defensoras de los derechos de autor están presionando para que el caso se tome como un precedente, lo que podría restringir o prohibir el uso de material protegido para entrenar modelos de IA en el futuro.
El Tribunal de California se encuentra actualmente evaluando el caso, y se espera que la resolución podría tardar varios meses. Si se determina que Meta violó las leyes de derechos de autor, las implicaciones podrían ser significativas no solo para Meta, sino para toda la industria de la IA.
Conclusión: La necesidad de regular el uso de datos en la IA
La demanda contra Meta pone de manifiesto una cuestión crucial: ¿cómo deben las grandes empresas tecnológicas manejar los datos protegidos por derechos de autor? A medida que la inteligencia artificial sigue avanzando, es esencial que existan regulaciones claras que protejan los derechos de los creadores de contenido, al tiempo que permiten que la tecnología continúe desarrollándose.
Si bien la innovación en IA es fundamental, es igualmente importante que las empresas respeten los derechos de autor y protejan la privacidad de los usuarios. El caso de Meta podría ser el primer paso hacia una nueva era de regulación de la IA, una era donde se equilibran la innovación tecnológica y el respeto por la propiedad intelectual.
Quizás también te pueda interesar el siguiente articulo: Reino Unido exige acceso a datos cifrados de Apple: Privacidad vs seguridad nacional