Le monde littéraire se heurte à la Silicon Valley dans ce qui pourrait être la bataille judiciaire définitive de l’ère de l’intelligence artificielle. Microsoft se retrouve dans la ligne de mire après qu’un groupe d’auteurs a intenté un procès alléguant que le géant technologique a utilisé des milliers de livres protégés par des droits d’auteur sans permission pour entraîner ses systèmes d’intelligence artificielle.
Déposée hier devant un tribunal fédéral de New York, la poursuite affirme que Microsoft a intégré de nombreuses œuvres protégées dans les données d’entraînement de ses modèles d’IA sans obtenir les droits ni offrir de compensation aux créateurs. La plainte des auteurs cible spécifiquement le partenariat de Microsoft avec OpenAI et le développement de systèmes comme ChatGPT et Copilot.
« Cela représente une question fondamentale sur la propriété créative à l’ère numérique », a déclaré Me Melissa Tanner, avocate spécialisée en droits d’auteur numériques. « Les entreprises sont-elles autorisées à consommer des bibliothèques créatives entières pour alimenter des systèmes d’IA générant des profits sans indemniser les créateurs originaux? »
Cette poursuite fait suite à des contestations juridiques similaires contre d’autres entreprises technologiques, notamment une affaire très médiatisée l’an dernier où plusieurs romanciers renommés ont poursuivi OpenAI directement. Ces cas suggèrent collectivement une tempête qui se prépare autour de la façon dont les développeurs d’IA s’approvisionnent en matériaux d’entraînement.
Ce qui rend cette affaire particulièrement remarquable est la spécificité des allégations. Les auteurs affirment avoir trouvé des preuves que leurs formulations exactes, leurs structures narratives uniques et leurs développements de personnages distinctifs apparaissent dans les résultats de l’IA de Microsoft. Ces « empreintes littéraires » forment l’épine dorsale de leur argumentation juridique.
Microsoft a répondu par une déclaration défendant ses pratiques: « Nous croyons que notre utilisation des données d’entraînement relève de la doctrine d’utilisation équitable et contribue à l’avancement technologique qui, en fin de compte, profite aux créateurs. » L’entreprise maintient que les systèmes d’IA apprennent des modèles plutôt que de mémoriser du contenu spécifique, bien que des experts techniques aient de plus en plus remis en question cette distinction.
Les enjeux financiers sont énormes. Microsoft a investi plus de 13 milliards de dollars dans OpenAI et intégré des capacités d’IA dans tout son écosystème de produits. La capitalisation boursière de l’entreprise a augmenté de centaines de milliards de dollars en partie grâce à sa stratégie d’IA. Pendant ce temps, les auteurs signalent une baisse des redevances et des avances qui diminuent dans l’industrie de l’édition.
« Ce à quoi nous assistons est un transfert massif de valeur », a expliqué Janine Rodriguez, analyste de l’industrie de l’édition chez Morgan Stanley. « L’économie créative qui a soutenu les auteurs pendant des générations est en train d’être remodelée, avec des entreprises technologiques qui extraient la valeur des œuvres créatives sans rien offrir en retour. »
La réalité technique derrière le procès concerne le fonctionnement des grands modèles de langage. Ces systèmes d’IA nécessitent d’énormes ensembles de données pour apprendre les modèles linguistiques, les livres fournissant certains des matériaux écrits de la plus haute qualité disponibles. Des documents internes révélés lors de découvertes dans des affaires précédentes ont montré que les entreprises technologiques recherchaient spécifiquement des livres pour leur correction grammaticale, leur cohérence narrative et leur vocabulaire diversifié.
Les éditeurs canadiens suivent l’affaire de près. « Cela a des implications pour chaque créateur, » a noté Richard Thompson, directeur exécutif du Conseil des éditeurs canadiens. « Si Microsoft l’emporte, cela établit un précédent selon lequel les œuvres créatives peuvent être utilisées sans permission pour le développement commercial de l’IA. »
Au-delà des questions juridiques immédiates, l’affaire met en lumière la tension croissante entre l’innovation technologique et les cadres établis du droit d’auteur. Les lois écrites pour l’ère de l’imprimé et du début du numérique peinent à aborder des scénarios où des machines « lisent » des milliers de livres pour apprendre à générer du nouveau contenu.
Certains auteurs ont adopté des positions pragmatiques. L’écrivain de science-fiction à succès Marcus Chen m’a confié: « Je ne suis pas catégoriquement contre l’utilisation de mon travail par l’IA, mais je veux une compensation équitable et de la transparence. Mes livres représentent des années de recherche et de créativité—cela a une valeur. »
L’affaire soulève également des questions sur l’avenir de la créativité humaine. Si les systèmes d’IA peuvent générer du contenu acceptable basé sur des œuvres existantes, qu’advient-il de la prochaine génération d’écrivains? L’agente littéraire Sarah Whittaker a exprimé son inquiétude: « Les avances des éditeurs financent les auteurs pendant qu’ils créent de nouvelles œuvres. Si l’IA érode cette fondation économique, nous verrons moins de voix et moins de narration innovante. »
Microsoft et d’autres entreprises technologiques ont commencé à explorer des solutions potentielles, notamment des modèles de licence, des arrangements de partage des bénéfices et des mécanismes de désabonnement pour les créateurs. Cependant, les critiques soutiennent que ces efforts restent insuffisants et arrivent trop tard, après que les systèmes d’IA ont déjà été entraînés sur de vastes bibliothèques.
L’affaire a également attiré l’attention des organismes de réglementation. Le Bureau américain du droit d’auteur a lancé une série d’enquêtes sur l’IA et le droit d’auteur, tandis que les législateurs de plusieurs pays envisagent une législation mise à jour qui aborde explicitement les pratiques d’entraînement de l’IA.
Pour les lecteurs ordinaires, le résultat pourrait déterminer si les livres futurs proviennent principalement d’esprits humains ou de systèmes d’IA entraînés sur la créativité humaine. Cela pourrait également influencer l’économie de l’édition—affectant potentiellement tout, des prix des livres à la diversité des auteurs.
Alors que l’affaire progresse dans le système judiciaire, une chose est certaine: l’intersection de l’IA et du droit d’auteur n’est plus une préoccupation théorique mais une réalité pressante avec des milliards de dollars et l’avenir des industries créatives en jeu.
Le procès devrait prendre des mois, voire des années, à résoudre, mais ses implications se répercuteront dans les mondes de la technologie et de l’édition bien avant qu’un verdict ne soit rendu. Pour les auteurs comme pour les entreprises technologiques, cela représente un moment charnière dans la définition des limites de la propriété créative à l’ère de l’IA.