libri distrutti per alimentare Claude

Des millions de livres achetés, coupés et nourris à l'IA pour former Claude et contourner le droit d'auteur : l'affaire Anthropic éclate

Le cas du Projet Panama montre une chose simple : derrière l’intelligence artificielle, il y a aussi des livres physiques, découpés et transformés en données.

Un livre, avant de devenir un dossier, reste un objet. Il a un dos, des pages, de la colle, du poids, de la poussière. Dans le cas d'Anthropic, la société qui développe Claude, cette partie très concrète a abouti à un procédé industriel : des livres achetés sur le marché de l'occasion, découpés, numérisés et transformés en texte numérique. Ce qui restait des volumes était ensuite envoyé au recyclage.

Le nom interne du projet était Projet Panama. À partir des documents qui ont émergé dans l’affaire des droits d’auteur, on comprend le sens de l’opération : collecter une grande quantité de livres physiques pour entraîner des modèles d’intelligence artificielle. Les livres étaient utiles car ils étaient considérés comme un meilleur sujet linguistique que le bruit du Web. Moins de phrases collectées au hasard en ligne, plus de textes écrits, édités et publiés.

Des livres aux données

Le plus fort réside dans la méthode. Les volumes provenaient de brocanteurs, étaient préparés pour un scan destructif, découpés le long du dos et passés par des scanners professionnels à grande vitesse. Une fois numérisés, plus aucun livre n’est revenu. Il restait des données d'un côté, du papier à recycler de l'autre.

'; var fallbackTriggered = faux ; var timeoutId = null ; function renderTaboolaFallback(reason) { if (fallbackTriggered) return ; fallbackTriggered = vrai ; si (timeoutId) { clearTimeout (timeoutId); timeoutId = nul ; } console.log('(ADV) Rendu de secours Taboola. Raison :', raison); root.innerHTML = ''; window._taboola.push({ mode : 'thumbnails-300×250', conteneur : taboolaDivId, placement : 'Widget milieu d'article 300×250', target_type : 'mix' }); // Si votre intégration Taboola le nécessite, décommentez : // window._taboola.push({ flush: true }); } googletag.cmd.push(function () { console.log('(ADV) GPT init', gptDivId); var gptSlot = googletag .defineSlot('/22142119198/greenme.it/roller', (300, 250), gptDivId) .addService(googletag.pubads()); googletag.pubads (). event.lineItemId }); if (fallbackTriggered) return ; if (event.isEmpty) { renderTaboolaFallback('gpt-empty'); googletag.enableServices();

Les quantités précises ne sont pas tout à fait claires, mais nous parlons de centaines de milliers, voire de millions de volumes, avec un projet visant à numériser entre 500 000 et 2 millions de livres en six mois environ. Ce n’est pas une petite opération d’archivage. Une chaîne d'approvisionnement, avec les fournisseurs, les entrepôts, les machines de découpe, les scanners, les coûts et la logistique.

Et c’est là que l’affaire devient intéressante même en dehors du débat juridique. L’intelligence artificielle est souvent décrite comme quelque chose de léger, lointain, presque immatériel : cloud, algorithme, interface épurée. Mais ici, le nuage fait le bruit du papier. On y retrouve des cartons, des lames industrielles, des pages détachées, des livres achetés et démontés.

'; var fallbackTriggered = faux ; var timeoutId = null ; function renderTaboolaFallback(reason) { if (fallbackTriggered) return ; fallbackTriggered = vrai ; si (timeoutId) { clearTimeout (timeoutId); timeoutId = nul ; } console.log('(ADV2) Render Taboola fallback. Reason:', Reason); root.innerHTML = ''; window._taboola.push({ mode : 'thumbnails-300×250', conteneur : taboolaDivId, emplacement : 'Widget milieu d'article 300×250-2', target_type : 'mix' }); } googletag.cmd.push(function () { console.log('(ADV2) GPT init', gptDivId); var gptSlot = googletag.pubads().getSlots().find(function(s) { return s.getSlotElementId() === gptDivId; }); if (!gptSlot) { console.warn('(ADV2) Slot not found:', gptDivId); renderTaboolaFallback('slot-not-found'); return; } googletag.pubads().addEventListener('slotRenderEnded', function (event) { if (event.slot !== gptSlot) return; console.log('(ADV2) slotRenderEnded', { isEmpty: event.isEmpty, size: event.size, warnerId : event.advertiserId, CampaignId : event.campaignId, lineItemId : event.lineItemId } ; if (fallbackTriggered) return ; if (timeoutId) { clearTimeout(timeoutId } ); console.log('(ADV2) GPT a diffusé une création');

La question du droit d'auteur

Dans la procédure américaine, le juge William Alsup a distingué deux niveaux. L'utilisation de livres achetés légalement puis numérisés pour former Claude était considérée comme compatible avec le fair use, la doctrine américaine qui permet dans certains cas l'utilisation d'œuvres protégées sans autorisation. L’histoire des livres piratés était différente : les documents révélaient qu’Anthropic avait téléchargé et stocké des millions de textes issus d’archives illégales, et cette partie était traitée comme une violation distincte.

Le passage aux livres physiques d’occasion apparaît donc aussi comme un choix de prudence juridique. L'achat d'une copie papier a donné à l'entreprise une base plus solide que le téléchargement à partir de bibliothèques pirates. Aux États-Unis, quiconque achète un objet physique peut le revendre, le prêter ou le détruire. Le problème se pose lorsque cet objet est transformé en copie numérique et inséré dans des systèmes capables de générer un nouveau texte.

Anthropic a ensuite accepté un règlement de 1,5 milliard de dollars pour régler le recours collectif des auteurs, sans admettre sa responsabilité. Le règlement couvre les œuvres piratées et prévoit environ 3 000 $ par livre impliqué. Cependant, en mai 2026, l'approbation finale était toujours en cours d'examen : la juge Araceli Martinez-Olguin a demandé plus de détails sur les frais juridiques et les paiements aux principaux plaignants.

'; var fallbackTriggered = faux ; var timeoutId = null ; function renderTaboolaFallback(reason) { if (fallbackTriggered) return ; fallbackTriggered = vrai ; si (timeoutId) { clearTimeout (timeoutId); timeoutId = nul ; } console.log('(ADV3) Render Taboola fallback. Reason:', Reason); root.innerHTML = ''; window._taboola.push({ mode : 'thumbnails-300×250', conteneur : taboolaDivId, emplacement : 'Widget milieu d'article 300×250-3', target_type : 'mix' }); } googletag.cmd.push(function () { console.log('(ADV3) GPT init', gptDivId); var gptSlot = googletag.pubads().getSlots().find(function(s) { return s.getSlotElementId() === gptDivId; }); if (!gptSlot) { console.warn('(ADV3) Slot not found:', gptDivId); renderTaboolaFallback('slot-not-found'); return; } googletag.pubads().addEventListener('slotRenderEnded', function (event) { if (event.slot !== gptSlot) return; console.log('(ADV3) slotRenderEnded', { isEmpty: event.isEmpty, size: event.size, warnerId: event.advertiserId, CampaignId: event.campaignId, lineItemId: event.lineItemId }); if (fallbackTriggered) return ; if (timeoutId) { clearTimeout(timeoutId } console.log('(ADV3) GPT a diffusé une création');

L'IA ne surgit pas de nulle part

Le cas Anthropic concerne Claude, mais il parle à toute la filière. Les grands modèles génératifs ont besoin de textes, d’images, de codes, d’articles, de manuels, de romans, d’essais. Ils ont besoin de travail humain déjà produit. Parfois, ce travail est autorisé et payé. D’autres fois, ces informations sont collectées en masse, intégrées dans des ensembles de données opaques et discutées uniquement lorsqu’un procès arrive.

Le projet Panama rend cette dépendance visible. Pour qu’une machine puisse mieux écrire, il fallait des livres écrits par des personnes. Pour rendre un chatbot plus naturel, des œuvres créées par des auteurs, des éditeurs, des traducteurs, des correcteurs, des maisons d'édition, des bibliothèques et des lecteurs ont été utilisées. La promesse numérique repose encore sur une matière très physique.

Le sujet concerne également l’Europe, où la relation entre droit d’auteur, data mining et intelligence artificielle reste ouverte. Les entreprises parlent d'innovation, de transformation, de progrès. Ceux qui créent du contenu demandent des autorisations, une compensation, une traçabilité. Au milieu, il y a des tribunaux, des règles encore jeunes et une question très concrète : combien vaut le travail humain lorsqu’il devient le carburant de l’IA ?

'; var fallbackTriggered = faux ; var timeoutId = null ; function renderTaboolaFallback(reason) { if (fallbackTriggered) return ; fallbackTriggered = vrai ; si (timeoutId) { clearTimeout (timeoutId); timeoutId = nul ; } console.log('(ADV4) Render Taboola fallback. Reason:', Reason); root.innerHTML = ''; window._taboola.push({ mode : 'thumbnails-300×250', conteneur : taboolaDivId, emplacement : 'Widget milieu d'article 300×250-4', target_type : 'mix' }); } googletag.cmd.push(function () { console.log('(ADV4) GPT init', gptDivId); var gptSlot = googletag.pubads().getSlots().find(function(s) { return s.getSlotElementId() === gptDivId; }); if (!gptSlot) { console.warn('(ADV4) Slot not found:', gptDivId); renderTaboolaFallback('slot-not-found'); return; } googletag.pubads().addEventListener('slotRenderEnded', function (event) { if (event.slot !== gptSlot) return; console.log('(ADV4) slotRenderEnded', { isEmpty: event.isEmpty, size: event.size, warnerId : event.advertiserId, CampaignId : event.campaignId, lineItemId : event.lineItemId } ; if (fallbackTriggered) return ; if (timeoutId) { clearTimeout(timeoutId } ); console.log('(ADV4) GPT a diffusé une création');

A lire également