Une action en justice collective ("class action") a été introduite le 19 août 2024 devant la Cour fédérale de district de Californie du Nord (Division de San Francisco) par trois auteurs, Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, contre la société Anthropic PBC, développeur du modèle de langage Claude. Fondée en janvier 2021 par sept anciens employés d'OpenAI, dont l'actuel PDG Dario Amodei, ancien vice-président de la recherche chez OpenAI, Anthropic a lancé son modèle Claude en mars 2023, suivi de Claude 2 en juillet 2023, puis des versions Claude 3 et Claude 3.5 en 2024.
Cette action s'inscrit dans la lignée d'autres contentieux similaires engagés notamment par des auteurs contre Meta Platforms, Microsoft et OpenAI devant les juridictions fédérales américaines en 2023. En particulier, le New York Times a intenté le 27 décembre 2023 une action contre OpenAI et Microsoft devant la Cour fédérale de Manhattan, alléguant l'utilisation non autorisée de millions d'articles pour entraîner ChatGPT Cette procédure a notamment mis en lumière la capacité des modèles d'IA à reproduire textuellement des articles du journal, compromettant ainsi potentiellement son modèle économique basé sur les abonnements.
Les demandeurs, agissant pour leur compte et celui d'une classe potentielle de milliers d'auteurs, allèguent qu'Anthropic aurait massivement violé leurs droits d'auteur en reproduisant sans autorisation leurs œuvres littéraires pour entraîner ses modèles d'intelligence artificielle. Selon la plainte, "Anthropic aurait construit une entreprise valorisée plusieurs milliards de dollars en s'appropriant des centaines de milliers de livres protégés par le droit d'auteur" et "plutôt que d'obtenir une autorisation et de payer un prix équitable pour les créations qu'elle exploite, Anthropic les aurait utilisées sans autorisation." Les plaignants soutiennent qu'Anthropic aurait sciemment téléchargé et copié des versions piratées de leurs livres, notamment via l'utilisation d'une base de données appelée "The Pile" contenant "Books3", une collection de près de 200 000 ouvrages issus du site Bibliotik. La plainte souligne que les créateurs d'EleutherAI, à l'origine de "The Pile", ont explicitement reconnu que "Books3 est presque entièrement composé d'œuvres protégées par le droit d'auteur".
Cette exploitation non autorisée aurait permis à Anthropic de développer son modèle Claude et de générer des revenus considérables, avec des projections dépassant 850 millions de dollars pour 2024. Les demandeurs fondent leur action sur la violation de leurs droits exclusifs de reproduction et de distribution garantis par le paragraphe 106 du titre 17 du U.S. Code, et invoquent spécifiquement l'article 501 de ce même titre relatif aux atteintes au droit d'auteur. Ils soulignent qu'Anthropic aurait pu, comme d'autres entreprises d'IA telles qu'OpenAI, Google et Meta, obtenir des licences légales moyennant "des centaines de millions de dollars pour reproduire du matériel protégé par le droit d'auteur pour l'entraînement des LLM", citant notamment les accords conclus avec Axel Springer, News Corporation et l'Associated Press.
L'issue de ces multiples procédures demeure incertaine, le contentieux entre les industries des médias et de la création et les développeurs d'IA générative étant susceptible de se résoudre par des accords de licence, à l'instar de ceux conclus par OpenAI avec Axel Springer ou l'Associated Press. Ces accords, potentiellement rémunérateurs pour les ayants droit, pourraient préfigurer un nouveau modèle économique pour l'exploitation des contenus protégés par les systèmes d'IA.
Il est à noter qu'aucune action similaire n'a pour l'instant été engagée devant les juridictions françaises, bien que la problématique de l'utilisation non autorisée d'œuvres protégées pour l'entraînement des modèles d'IA se pose également en droit français, notamment au regard des dispositions du Code de la propriété intellectuelle relatives au droit d'auteur et à l'exception de fouille de textes et de données.
N.B Remerciements de l’auteur à Lou Dutreil, stagiaire DDG, pour son aide précieuse à la rédaction de cet article.