Un juge rejette le procès pour atteinte aux droits d'auteur intenté par les auteurs contre Meta concernant la formation de l'IA

SAN FRANCISCO -- Un juge fédéral s'est rangé du côté de Meta Platforms, la société mère de Facebook, en rejetant une action en justice pour violation du droit d'auteur intentée par un groupe d'auteurs qui accusaient l'entreprise d'avoir volé leurs œuvres pour former sa technologie d'intelligence artificielle.
La décision rendue mercredi par le juge de district américain Vince Chhabria est la deuxième en une semaine par le tribunal fédéral de San Francisco à rejeter d'importantes réclamations de droits d'auteur déposées par des auteurs de livres contre l'industrie de l'IA en plein développement.
Chhabria a estimé que les 13 auteurs qui avaient poursuivi Meta « avaient avancé des arguments erronés » et a rejeté l'affaire. Le juge a toutefois précisé que la décision se limitait aux auteurs concernés et ne signifiait pas que l'utilisation par Meta de documents protégés par le droit d'auteur était légale.
« Cette décision ne confirme pas la légalité de l'utilisation par Meta de documents protégés par le droit d'auteur pour former ses modèles linguistiques », a écrit Chhabria. « Elle confirme seulement que les plaignants ont avancé des arguments erronés et n'ont pas fourni de preuves à l'appui des arguments pertinents. »
Les avocats des plaignants – un groupe d'écrivains renommés comprenant l'humoriste Sarah Silverman et les auteurs Jacqueline Woodson et Ta-Nehisi Coates – ont déclaré dans un communiqué que le tribunal avait jugé que les entreprises d'IA qui intègrent des œuvres protégées par le droit d'auteur dans leurs modèles sans obtenir l'autorisation des titulaires de droits ni les rémunérer enfreignent généralement la loi. Pourtant, malgré le bilan incontesté de Meta en matière de piratage d'œuvres protégées par le droit d'auteur, sans précédent dans l'histoire, le tribunal a statué en faveur de Meta. Nous ne partageons respectueusement pas cette conclusion.
Meta a déclaré qu'il appréciait la décision.
« Les modèles d'IA open source alimentent les innovations transformatrices, la productivité et la créativité des particuliers et des entreprises, et l'utilisation équitable du matériel protégé par le droit d'auteur est un cadre juridique essentiel pour la construction de cette technologie transformatrice », a déclaré la société basée à Menlo Park, en Californie, dans un communiqué.
Bien que Meta ait obtenu gain de cause dans sa demande de rejet de l'affaire, celle-ci pourrait s'avérer une victoire à la Pyrrhus. Dans sa décision de 40 pages, Chhabria a maintes fois indiqué des raisons de croire que Meta et d'autres entreprises d'IA sont devenues des contrevenants en série au droit d'auteur en adaptant leur technologie à des livres et autres œuvres créées par des humains, et semblait inviter d'autres auteurs à saisir son tribunal, en présentant leurs affaires de manière à ce qu'elles puissent être jugées.
Le juge a tourné en dérision les arguments selon lesquels obliger les entreprises d'IA à respecter des lois sur le droit d'auteur vieilles de plusieurs décennies ralentirait les progrès d'une technologie cruciale à un moment crucial. « Ces produits devraient générer des milliards, voire des milliers de milliards de dollars pour les entreprises qui les développent. Si l'utilisation d'œuvres protégées par le droit d'auteur pour entraîner les modèles est aussi nécessaire que le prétendent les entreprises, elles trouveront un moyen de rémunérer les titulaires de droits. »
Lundi, depuis le même tribunal, le juge de district américain William Alsup a statué que la société d'IA Anthropic n'avait pas enfreint la loi en formant son chatbot Claude sur des millions de livres protégés par le droit d'auteur, mais la société doit toujours être jugée pour avoir acquis illégalement ces livres sur des sites Web pirates au lieu de les acheter.
Mais le processus réel par lequel un système d’IA distille à partir de milliers d’œuvres écrites pour être en mesure de produire ses propres passages de texte est qualifié d’« usage équitable » selon la loi américaine sur le droit d’auteur, car il est « fondamentalement transformateur », a écrit Alsup.
Dans l'affaire Meta, les auteurs ont fait valoir devant le tribunal que Meta était « responsable d'une violation massive du droit d'auteur » en prenant leurs livres à partir de référentiels en ligne d'œuvres piratées et en les introduisant dans le système d'IA générative phare de Meta, Llama.
Les passages de texte longs et singuliers, comme ceux que l'on trouve dans les livres, sont très utiles pour enseigner aux chatbots génératifs d'IA les schémas du langage humain. « Meta aurait pu et dû payer » pour acheter et obtenir une licence pour ces œuvres littéraires, ont fait valoir les avocats des auteurs.
Meta a rétorqué devant le tribunal que la loi américaine sur le droit d'auteur « autorise la copie non autorisée d'une œuvre pour la transformer en quelque chose de nouveau » et que la nouvelle expression générée par l'IA qui sort de ses chatbots est fondamentalement différente des livres sur lesquels elle a été formée.
« Après près de deux ans de litige, il n'y a toujours aucune preuve que quiconque ait jamais utilisé Llama comme substitut à la lecture des livres des plaignants, ou qu'ils aient même pu le faire », ont soutenu les avocats de Meta.
Meta affirme que Llama ne publiera pas les œuvres qu'il a réellement copiées, même lorsqu'on lui demande de le faire.
« Personne ne peut utiliser Llama pour lire la description de l'enfance de Sarah Silverman, ou l'histoire de Junot Diaz sur un garçon dominicain grandissant dans le New Jersey », ont écrit ses avocats.
Accusé d'avoir retiré ces livres des « bibliothèques fantômes » en ligne, Meta a également soutenu que les méthodes utilisées n'avaient « aucun rapport avec la nature et le but de leur utilisation » et que le résultat aurait été le même si l'entreprise avait plutôt conclu un accord avec de vraies bibliothèques .
De tels accords sont la façon dont Google a construit son référentiel en ligne Google Books de plus de 20 millions de livres, bien qu'il ait également lutté pendant une décennie contre les contestations judiciaires avant que la Cour suprême des États-Unis en 2016 ne maintienne les décisions des tribunaux inférieurs qui ont rejeté les plaintes pour violation du droit d'auteur.
L'affaire des auteurs contre Meta a forcé le PDG Mark Zuckerberg à être destitué et a révélé des conversations internes au sein de l'entreprise sur l'éthique de l'accès à des bases de données piratées qui ont longtemps attiré l'attention.
« Les autorités ferment régulièrement leurs domaines et poursuivent même les auteurs en justice », ont fait valoir les avocats des auteurs dans un dossier judiciaire. « Il est incontestable que Meta savait que récupérer des œuvres protégées par le droit d'auteur provenant de bases de données piratées pouvait exposer l'entreprise à un risque énorme : cela a déclenché une escalade vers Mark Zuckerberg et d'autres dirigeants de Meta pour obtenir leur approbation. Leur pari ne devrait pas être payant. »
Les plaignants nommés sont Jacqueline Woodson, Richard Kadrey, Andrew Sean Greer, Rachel Louise Snyder, David Henry Hwang, Ta-Nehisi Coates, Laura Lippman, Matthew Klam, Junot Diaz, Sarah Silverman, Lysa TerKeurst, Christopher Golden et Christopher Farnsworth.
Chhabria a déclaré dans sa décision que, bien qu'il n'ait eu « d'autre choix » que d'accorder le jugement sommaire de Meta rejetant l'affaire, « dans l'ensemble, les conséquences de cette décision sont limitées. Il ne s'agit pas d'un recours collectif ; la décision n'affecte donc que les droits de ces 13 auteurs, et non ceux des innombrables autres dont Meta a utilisé les œuvres pour former ses modèles. »
—
Michael Liedtke, journaliste spécialisé dans les technologies chez AP, a contribué à cet article.
ABC News