Téléchargez gratuitement notre eBook "Pour une stratégie d'entreprise éco-responsable"
télécharger
French
French
Actualité
5/3/25

La société canadienne Cohere, star de l’IA d’entreprises, poursuivie pour contrefaçon par des éditeurs de presse devant les tribunaux de New York

Le 13 février 2025, un consortium de 14 éditeurs internationaux de renom, dont Condé Nast, Forbes, The Atlantic et The Guardian, a intenté une action en justice contre Cohere Inc., alléguant de nombreuses violations de droits d'auteur et de marques. La plainte a été déposée auprès du tribunal du district sud de New York, déjà saisi de la célèbre affaire en cours opposant OpenAI au New York Times. Les éditeurs accusent Cohere d'avoir utilisé sans autorisation plus de 4 000 œuvres protégées par des droits d'auteur pour entraîner ses modèles d'IA et d'avoir affiché des articles de presse sans diriger les utilisateurs vers les sites Web des éditeurs d'origine. 

Cohere est une licorne canadienne basée à Toronto spécialisée dans l’IA d’entreprise. Elle a été fondée en 2019 par, trois anciens employés de Google Brain, Aidan Gomez, Ivan Zhang et Nick Frosst. Elle permet aux entreprises d'intégrer sa plateforme d’IA sur des clouds publics (par exemple, Google Cloud, Amazon Web Services), des clouds privés virtuels ou encore en local. En juillet 2024, la société a levé 500 millions de dollars, avec une valorisation à 5,5 milliards de dollars. Cohere rivalise aujourd’hui avec d’autres IA ciblant les entreprises tels que Copilot de Microsoft ou encore Google Vertex AI. 

Un groupe d’éditeurs s’est réuni au sein d’un consortium afin de renforcer son action dans la plainte intentée contre Cohere. Ce consortium rassemble de nombreux journaux généralistes et magazines américains (The New Yorker, Vogue, Forbes, Politico), canadiens (Toronto Star Newspapers) et britanniques (The Guardian).

Les plaignants affirment que les pratiques de Cohere violent non seulement leurs droits de propriété intellectuelle, mais sapent également leurs modèles commerciaux, qui dépendent fortement des revenus publicitaires et des abonnements. Ils soutiennent qu'en fournissant aux utilisateurs un contenu qui reflète ou reproduit étroitement leurs articles originaux, Cohere détourne le trafic de leurs plateformes, ce qui a un impact sur leur viabilité financière. En outre, la plainte met en évidence des cas où l'IA de Cohere a généré un contenu « halluciné » - des articles fabriqués et attribués aux éditeurs - qui pourrait nuire à leur réputation.

En réponse, Cohere a réfuté les allégations, qualifiant le procès de « malavisé et frivole ». Un porte-parole de l'entreprise a déclaré que Cohere maintenait ses pratiques de formation responsable de son IA d'entreprise et avait mis en place des contrôles pour atténuer le risque de violation de la propriété intellectuelle. L'entreprise a exprimé sa préférence pour un dialogue direct afin de répondre aux préoccupations des éditeurs plutôt que pour un litige. 

Les principaux fondements légaux de la plainte des éditeurs comprennent :

  1. Violation du droit d'auteur (17 U.S.C. § 101, et seq.) – Cohere aurait copié et utilisé les œuvres protégées par le droit d'auteur des éditeurs dans sa formation et sa génération de résultats d'IA sans licence avec les éditeurs.
  2. Contrefaçon de marque (15 U.S.C. § 1051, et seq. - Lanham Act) – Cohere est accusé d'avoir attribué à tort du contenu généré par l'IA aux éditeurs, induisant ainsi le public en erreur.
  3. Concurrence déloyale – Les éditeurs affirment que Cohere se livre à une concurrence déloyale en utilisant du contenu journalistique protégé pour fournir des services similaires sans rémunérer les créateurs originaux.

1. La violation du droit d’auteur des éditeurs

Les éditeurs accusent Cohere de violation du droit d’auteur, lui reprochant d’avoir copié et exploité leurs contenus sans autorisation. Selon la plainte, Cohere aurait récupéré et dupliqué plus de 4 000 articles, y compris des contenus payants, directement depuis les sites web des éditeurs. Ces œuvres auraient ensuite servi à entraîner ses modèles d’intelligence artificielle, dont les résultats générés incluraient des extraits textuels ou des résumés des articles originaux, se substituant ainsi aux sources légitimes.

Les preuves produites par les éditeurs sont des captures d’écran de l’IA de Cohere démontrant notamment que lorsque les utilisateurs demandent un résumé d’un article, l’article est certes résumé mais également disponible en entier dans la section « Under the Hood » de l’IA. La section « Under the Hood » affiche le raisonnement de l’IA en langage non codé : 

Capture d’écran de la plainte des éditeurs contre Cohere page 33

Dans certains cas, l’IA de Cohere semble « régurgiter » les articles des journaux en modifiant peu ou prou les articles. Dans certains cas, les résumés recopieraient quasiment mot pour mot les articles des éditeurs :

Capture d’écran de la plainte des éditeurs contre Cohere 45

En conséquence, les éditeurs réclament une indemnisation pour le préjudice subi sur le marché des licences. Ils soutiennent que les pratiques de Cohere nuisent aux modèles économiques établis et émergents de concession de licences de contenus d’actualité. Alors que d’autres acteurs du secteur, comme OpenAI, ont négocié des accords de licence avec divers éditeurs, Cohere n’aurait entrepris aucune démarche en ce sens. 

Les éditeurs dénoncent également l’usage abusif de la génération augmentée par récupération (RAG) par Cohere, qu’ils considèrent comme une forme de contrefaçon continue. Ce procédé permettrait à l’IA de Cohere de récupérer des données en temps réel sur Internet afin d’enrichir ses réponses. Or, la plainte affirme que cette technologie est utilisée pour extraire et reproduire activement des articles provenant des sites des éditeurs, ce qui constituerait une violation répétée et systématique du droit d’auteur.

2. La violation de la marque des éditeurs

Les éditeurs reprochent également à Cohere une violation de leurs marques déposées, qui correspondent aux titres de presse. La plainte allègue que l’IA de Cohere génère de faux articles qu’elle attribue à tort à des médias légitimes, induisant ainsi le public en erreur.

Par exemple, dans la section « Under the Hood » les sources des articles sont renseignés pour chaque contenu en utilisant les marques des éditeurs sur le contenu généré par l’IA.

Capture d’écran de la plainte des éditeurs contre Cohere page 43

Selon les plaignants, ces contenus artificiels donnent l’illusion qu’ils émanent de sources crédibles telles que The Guardian, Forbes ou Politico. En outre, l’utilisation non autorisée des marques et titres des éditeurs (Vogue, The New Yorker, Wired, Forbes, The Atlantic, Politico) pour identifier ces contenus générés constituerait à la fois une dilution de marque et une fausse association, portant atteinte à la réputation et à l’intégrité éditoriale des médias concernés.

3. Le préjudice fondé sur le droit de la concurrence et l’enrichissement sans cause

Selon les plaignants, Cohere se placerait en concurrence directe avec les éditeurs en générant, via son IA, des résumés d’articles d’actualité qui dissuaderaient les utilisateurs de consulter les sites d’origine.

La plainte allègue que Cohere exploite des contenus protégés par le droit d’auteur sans verser de compensation aux créateurs, constituant ainsi un enrichissement sans cause. En fournissant un accès facilité à l’information sans rediriger vers les sources officielles, les résultats produits par l’IA de Cohere réduiraient l’incitation des utilisateurs à souscrire à des abonnements aux éditeurs, fragilisant ainsi les revenus des éditeurs.

Les éditeurs demandent :

  1. Une injonction pour empêcher Cohere de continuer à utiliser leurs œuvres protégées par le droit d'auteur.
  2. Des dommages-intérêts pour violation du droit d'auteur et de la marque d’un montant de 150 000 $ par article ou œuvre contrefaite (soit au moins 600 millions $) ou alternativement les bénéfices qu’aurait réalisé Cohere grâce à la contrefaçon (à déterminer lors du procès). 
  3. La destruction des articles et résultats formés sur des données non autorisées.

4. Les jurisprudences en matière d’IA

Cette affaire rappelle le procès New York Times Contre OpenAI devant le même United States District Court Southern District Of New York. Le procès du New York Times contre OpenAI, intenté en décembre 2023, repose sur des accusations selon lesquelles OpenAI et Microsoft auraient utilisé, sans autorisation, des millions d’articles protégés par le droit d’auteur du New York Times pour entraîner leurs modèles d’intelligence artificielle, notamment ChatGPT. En janvier 2025, OpenAI et Microsoft ont déposé une « motion to dismiss », soutenant que leur utilisation des contenus du Times relève du fair use. À ce stade de la procédure, les plaidoiries ont été entendues par un juge fédéral, mais aucune décision n’a encore été rendue. Dans ce contexte, il est évident que les entreprises d’IA s’appuieront sur la doctrine du fair use pour justifier l’entraînement de leurs modèles sur des contenus protégés. Il est donc prévisible que Cohere adopte une défense similaire dans le cadre de l’action intentée contre elle. 

Si les éditeurs obtiennent gain de cause, les entreprises d'IA pourraient devoir rechercher des accords de licence avant d'entraîner des modèles sur des œuvres protégées par le droit d'auteur.

Affaire à suivre …

Vincent FAUCHOUX / Benjamin KAHN
Image par Canva
Découvrez le Livre Blanc : "Intelligence artificielle : quels enjeux juridiques"
Télécharger
Intelligence Artificielle : quels enjeux juridiques ?

Abonnez vous à notre Newsletter

Recevez chaque mois la lettre du DDG Lab sur l’actualité juridique du moment : retrouvez nos dernières brèves, vidéos, webinars et dossiers spéciaux.
je m'abonne
DDG utilise des cookies dans le but de vous proposer des services fonctionnels, dans le respect de notre politique de confidentialité et notre gestion des cookies (en savoir plus). Si vous acceptez les cookies, cliquer ici.