Le 13 février 2025, un consortium de 14 éditeurs internationaux de renom, dont Condé Nast, Forbes, The Atlantic et The Guardian, a intenté une action en justice contre Cohere Inc., alléguant de nombreuses violations de droits d'auteur et de marques. La plainte a été déposée auprès du tribunal du district sud de New York, déjà saisi de la célèbre affaire en cours opposant OpenAI au New York Times. Les éditeurs accusent Cohere d'avoir utilisé sans autorisation plus de 4 000 œuvres protégées par des droits d'auteur pour entraîner ses modèles d'IA et d'avoir affiché des articles de presse sans diriger les utilisateurs vers les sites Web des éditeurs d'origine.
Cohere est une licorne canadienne basée à Toronto spécialisée dans l’IA d’entreprise. Elle a été fondée en 2019 par, trois anciens employés de Google Brain, Aidan Gomez, Ivan Zhang et Nick Frosst. Elle permet aux entreprises d'intégrer sa plateforme d’IA sur des clouds publics (par exemple, Google Cloud, Amazon Web Services), des clouds privés virtuels ou encore en local. En juillet 2024, la société a levé 500 millions de dollars, avec une valorisation à 5,5 milliards de dollars. Cohere rivalise aujourd’hui avec d’autres IA ciblant les entreprises tels que Copilot de Microsoft ou encore Google Vertex AI.
Un groupe d’éditeurs s’est réuni au sein d’un consortium afin de renforcer son action dans la plainte intentée contre Cohere. Ce consortium rassemble de nombreux journaux généralistes et magazines américains (The New Yorker, Vogue, Forbes, Politico), canadiens (Toronto Star Newspapers) et britanniques (The Guardian).
Les plaignants affirment que les pratiques de Cohere violent non seulement leurs droits de propriété intellectuelle, mais sapent également leurs modèles commerciaux, qui dépendent fortement des revenus publicitaires et des abonnements. Ils soutiennent qu'en fournissant aux utilisateurs un contenu qui reflète ou reproduit étroitement leurs articles originaux, Cohere détourne le trafic de leurs plateformes, ce qui a un impact sur leur viabilité financière. En outre, la plainte met en évidence des cas où l'IA de Cohere a généré un contenu « halluciné » - des articles fabriqués et attribués aux éditeurs - qui pourrait nuire à leur réputation.
En réponse, Cohere a réfuté les allégations, qualifiant le procès de « malavisé et frivole ». Un porte-parole de l'entreprise a déclaré que Cohere maintenait ses pratiques de formation responsable de son IA d'entreprise et avait mis en place des contrôles pour atténuer le risque de violation de la propriété intellectuelle. L'entreprise a exprimé sa préférence pour un dialogue direct afin de répondre aux préoccupations des éditeurs plutôt que pour un litige.
Les principaux fondements légaux de la plainte des éditeurs comprennent :
Les éditeurs accusent Cohere de violation du droit d’auteur, lui reprochant d’avoir copié et exploité leurs contenus sans autorisation. Selon la plainte, Cohere aurait récupéré et dupliqué plus de 4 000 articles, y compris des contenus payants, directement depuis les sites web des éditeurs. Ces œuvres auraient ensuite servi à entraîner ses modèles d’intelligence artificielle, dont les résultats générés incluraient des extraits textuels ou des résumés des articles originaux, se substituant ainsi aux sources légitimes.
Les preuves produites par les éditeurs sont des captures d’écran de l’IA de Cohere démontrant notamment que lorsque les utilisateurs demandent un résumé d’un article, l’article est certes résumé mais également disponible en entier dans la section « Under the Hood » de l’IA. La section « Under the Hood » affiche le raisonnement de l’IA en langage non codé :
Dans certains cas, l’IA de Cohere semble « régurgiter » les articles des journaux en modifiant peu ou prou les articles. Dans certains cas, les résumés recopieraient quasiment mot pour mot les articles des éditeurs :
En conséquence, les éditeurs réclament une indemnisation pour le préjudice subi sur le marché des licences. Ils soutiennent que les pratiques de Cohere nuisent aux modèles économiques établis et émergents de concession de licences de contenus d’actualité. Alors que d’autres acteurs du secteur, comme OpenAI, ont négocié des accords de licence avec divers éditeurs, Cohere n’aurait entrepris aucune démarche en ce sens.
Les éditeurs dénoncent également l’usage abusif de la génération augmentée par récupération (RAG) par Cohere, qu’ils considèrent comme une forme de contrefaçon continue. Ce procédé permettrait à l’IA de Cohere de récupérer des données en temps réel sur Internet afin d’enrichir ses réponses. Or, la plainte affirme que cette technologie est utilisée pour extraire et reproduire activement des articles provenant des sites des éditeurs, ce qui constituerait une violation répétée et systématique du droit d’auteur.
Les éditeurs reprochent également à Cohere une violation de leurs marques déposées, qui correspondent aux titres de presse. La plainte allègue que l’IA de Cohere génère de faux articles qu’elle attribue à tort à des médias légitimes, induisant ainsi le public en erreur.
Par exemple, dans la section « Under the Hood » les sources des articles sont renseignés pour chaque contenu en utilisant les marques des éditeurs sur le contenu généré par l’IA.
Selon les plaignants, ces contenus artificiels donnent l’illusion qu’ils émanent de sources crédibles telles que The Guardian, Forbes ou Politico. En outre, l’utilisation non autorisée des marques et titres des éditeurs (Vogue, The New Yorker, Wired, Forbes, The Atlantic, Politico) pour identifier ces contenus générés constituerait à la fois une dilution de marque et une fausse association, portant atteinte à la réputation et à l’intégrité éditoriale des médias concernés.
Selon les plaignants, Cohere se placerait en concurrence directe avec les éditeurs en générant, via son IA, des résumés d’articles d’actualité qui dissuaderaient les utilisateurs de consulter les sites d’origine.
La plainte allègue que Cohere exploite des contenus protégés par le droit d’auteur sans verser de compensation aux créateurs, constituant ainsi un enrichissement sans cause. En fournissant un accès facilité à l’information sans rediriger vers les sources officielles, les résultats produits par l’IA de Cohere réduiraient l’incitation des utilisateurs à souscrire à des abonnements aux éditeurs, fragilisant ainsi les revenus des éditeurs.
Les éditeurs demandent :
Cette affaire rappelle le procès New York Times Contre OpenAI devant le même United States District Court Southern District Of New York. Le procès du New York Times contre OpenAI, intenté en décembre 2023, repose sur des accusations selon lesquelles OpenAI et Microsoft auraient utilisé, sans autorisation, des millions d’articles protégés par le droit d’auteur du New York Times pour entraîner leurs modèles d’intelligence artificielle, notamment ChatGPT. En janvier 2025, OpenAI et Microsoft ont déposé une « motion to dismiss », soutenant que leur utilisation des contenus du Times relève du fair use. À ce stade de la procédure, les plaidoiries ont été entendues par un juge fédéral, mais aucune décision n’a encore été rendue. Dans ce contexte, il est évident que les entreprises d’IA s’appuieront sur la doctrine du fair use pour justifier l’entraînement de leurs modèles sur des contenus protégés. Il est donc prévisible que Cohere adopte une défense similaire dans le cadre de l’action intentée contre elle.
Si les éditeurs obtiennent gain de cause, les entreprises d'IA pourraient devoir rechercher des accords de licence avant d'entraîner des modèles sur des œuvres protégées par le droit d'auteur.
Affaire à suivre …
Sources :
Condé Nast, McClatchy and Other Publishers Accuse AI Firm Cohere of Copyright Violations :
Major media companies sue Cohere for alleged copyright infringement
Publishers vs. AI: Condé Nast Takes Cohere To Court - Trademark - India
News outlets sue Cohere over alleged copyright infringement
Publishers Launch Legal Battle Against AI Firm Cohere
Publishers sue AI startup Cohere over alleged copyright infringement
News publishers sue Cohere for copyright and trademark infringement