Éthique et Régulation

Meta accusé d’utiliser des données piratées pour le développement de l’IA.

Meta accusé d'utiliser des données piratées pour le développement de l'IA.
Simon Robben
Écrit par Simon Robben

Meta Accusé d’Utiliser des Données Piratées pour le Développement de l’IA

L’affaire judiciaire opposant Richard Kadrey et d’autres plaignants à Meta prend des tournures préoccupantes. Dans un récent dossier déposé auprès du tribunal de district des États-Unis dans le district nord de la Californie, les plaignants accusent Meta d’avoir sciemment intégré des œuvres protégées par le droit d’auteur dans le développement de ses modèles d’intelligence artificielle.

Accusations Grave de Piraterie Numérique

Les allégations sont lourdes : Meta aurait systématiquement utilisé des techniques de torrenting pour acquérir des jeux de données piratés, notamment ceux provenant de la célèbre bibliothèque numérique LibGen. Les documents déposés au tribunal révèlent des pratiques très compromettantes impliquant des responsables de haut niveau chez Meta. Selon les plaignants, le PDG Mark Zuckerberg aurait même donné son approbation explicite pour l’utilisation de ce jeu de données, et ce, malgré les préoccupations soulevées en interne par des dirigeants de l’équipe en charge de l’intelligence artificielle.

A lire aussi :  DeepSeek nous rappelle d'aborder l'inconnu de l'IA avec prudence - Actualités IA

Un mémo des discussions internes de Meta datant de décembre 2024 admet que LibGen est un “jeux de données que nous savons être piraté.” Des débats ont eu lieu quant aux implications éthiques et juridiques de l’utilisation de tels matériaux, tandis que plusieurs ingénieurs ont exprimé leur réticence à pratiquer le torrenting avec des ordinateurs de l’entreprise, suggérant des craintes quant à la légalité de ces actions.

Stripping de l’Information de Gestion des Droits d’Auteur

Les communications internes font également état d’une opération de suppression d’informations de gestion des droits d’auteur des œuvres acquises par Meta via LibGen. Selon la déposition de Michael Clark, représentant de l’entreprise, Meta aurait utilisé des scripts pour retirer toute indication de droit d’auteur des données, des mots-clés tels que “copyright” et des mentions sobres en étant des exemples. Clark a confirmé que cette manipulation avait pour but de préparer les données à l’entraînement de leurs modèles Llama.

Doutes et Réserves à l’Interne

Les préoccupations au sein de Meta étaient palpables. Des ingénieurs ont averti dans des échanges de courriels que le fait de céder à la tentation de télécharger des jeux de données piratés à partir de machines de l’entreprise semblait “douteux.” En janvier 2024, des déclarations judiciaires révèlent que Meta avait déjà téléchargé et distribué des données de LibGen, tandis que des documents vitaux avaient été obtenus par l’entreprise bien avant le début des procédures de découverte mais retenus pendant plusieurs mois.

A lire aussi :  La durabilité est essentielle en 2025 pour que les entreprises avancent dans leurs efforts en intelligence artificielle.

Lors d’une déposition en décembre 2024, Zuckerberg aurait quant à lui reconnu que ce type d’activité alignait l’entreprise sur des “bandes rouges” et que cela semblait être “un mauvais acte,” bien qu’il ait fourni des réponses limitées sur les pratiques d’entraînement plus larges de Meta.

Une Lutte Juridique qui S’Intensifie

Ce dossier, qui avait initialement été déposé au titre d’infraction de propriété intellectuelle, évolue vers l’inclusion de deux nouvelles accusations: une violation de la loi sur le Digital Millennium Copyright Act (DMCA) et une infraction à la California Comprehensive Data Access and Fraud Act (CDAFA). Les plaignants soutiennent que Meta a délibérément retiré les protections du droit d’auteur pour dissimuler les utilisations non autorisées de textes protégés dans ses modèles IA.

Impact Potentiel sur la Législation sur l’IA

Ce procès soulève des préoccupations majeures concernant le chevauchement entre la loi sur les droits d’auteur et le développement de l’intelligence artificielle. Les plaignants soutiennent que le fait de supprimer les protections des droits d’auteur prive les créateurs de leur juste compensation et permet à Meta de bâtir des systèmes d’IA sur les ruines financières du travail créatif d’auteurs et de maisons d’édition.

Cette affaire s’inscrit dans un contexte où les technologies d’IA générative subissent un examen minutieux à l’échelle mondiale, des entreprises telles qu’OpenAI et Google étant également mises en cause pour leur utilisation de données protégées pour former leurs modèles. Les tribunaux, aux États-Unis comme au Royaume-Uni, commencent à rendre des décisions qui pourraient façonner l’avenir des lois sur les droits d’auteur face aux avancées technologiques.

A lire aussi :  Frankie Woodhead, Thrive : Pourquoi les contributions neurodiverses sont cruciales pour le développement de l'IA - Actualités IA

Réputation et Futur de Meta en Jeu

Tandis que Meta continue de nier toutes les accusations formulées contre elle, les implications de cette affaire ne font que commencer à se dessiner. Si les plaignants réussissent dans leurs modifications, la réputation de Meta pourrait subir un revers significatif, surtout alors que l’entreprise compte sur l’intelligence artificielle pour son avenir. Les allégations de dépendance à des bibliothèques piratées compliquent encore ses ambitions de leadership dans le secteur.

Le dénouement de cette affaire pourrait clarifier des aspects cruciaux de la législation relative au développement des modèles d’IA dans un avenir proche, établissant éventuellement des précédents juridiques importants aux États-Unis et ailleurs.

A propos de l'auteur

Simon Robben

Simon Robben

Simon Robben est un expert reconnu en intelligence artificielle et en transformation numérique. Auteur principal du site Actualité I.A, il partage son expertise à travers des articles clairs et accessibles, dédiés à l'actualité de l'intelligence artificielle. Avec plusieurs années d'expérience dans le domaine, Simon suit de près les dernières avancées technologiques et leurs impacts sur les entreprises et la société.