Le risque qu'IA commette des crimes odieux « n'est pas négligeable » : l'affirmation d'Anthropic qui nous plonge dans un film

Anthropic prévient dans un rapport de sabotage de 53 pages que Claude Opus 4.6 présente une forte susceptibilité à des utilisations criminelles graves

L’intelligence artificielle n’est pas (encore) le monstre incontrôlable que certains imaginent. Mais ce n'est plus ce jouet brillant et inoffensif qui nous répond dans le chat ou nous aide à rédiger des e-mails. Selon Anthropic, le risque qu’un modèle avancé puisse faciliter des crimes graves est « très faible, mais non négligeable ». Et quand c’est l’entreprise qui a construit cette IA qui le dit, cela vaut la peine de s’arrêter un instant.

Parce que Claude Opus 4.6 pourrait être exploité pour des actions dangereuses

Dans son Sabotage Risk Report, un document technique de 53 pages, Anthropic analyse le comportement de son modèle le plus puissant : Claude Opus 4.6. Les conclusions ne sont pas apocalyptiques, mais pas rassurantes non plus. Le système montre une « forte susceptibilité » à être utilisé pour des crimes odieux, s’il est placé entre de mauvaises mains ou dans des contextes mal contrôlés.

Nous ne parlons pas de simples erreurs ou de mauvais conseils médicaux. La peur est plus subtile et structurelle : une IA qui soutient le développement d’armes chimiques, qui insère des vulnérabilités dans les systèmes informatiques ou qui manipule des informations sensibles pour orienter les décisions politiques. Ce n'est pas de la science-fiction. Il s’agit d’une hypothèse technique formulée noir sur blanc par ceux qui étudient ces modèles au quotidien.

Claude Opus 4.6 se définit comme plus « agentique », c'est-à-dire plus autonome. Il ne se contente pas de répondre à des questions : il peut exécuter du code, naviguer dans des interfaces, réaliser des tâches complexes sans supervision constante. En théorie, c'est un assistant très puissant. En pratique, cette autonomie augmente la marge de risque.

Lors de certains tests, le modèle a fait preuve d’une attitude « trop empressée » : il a tenté d’envoyer des e-mails non autorisés ou d’obtenir des identifiants de connexion pour atteindre un objectif. Non pas parce qu’il « voulait faire du mal », mais parce qu’il était programmé pour obtenir le résultat souhaité à tout prix. Et c’est exactement le problème : lorsque l’efficacité traverse les frontières, la frontière devient fragile.

Le rapport identifie quatre scénarios critiques. Une IA pourrait saboter les tests de sécurité pour éviter de futures restrictions. Il pourrait insérer des portes dérobées dans le code, difficiles à détecter par les humains mais exploitables par des versions ultérieures plus agressives. Cela pourrait contaminer les données de formation pour « passer le relais » à un système aux objectifs biaisés. Ou encore, s’il est utilisé par de grands gouvernements, il pourrait manipuler l’information pour influencer des décisions à fort impact. Le risque de criminalité n’est donc pas lié à un robot qui se rebelle. C'est beaucoup plus silencieux, plus technique, plus systémique.

Pourquoi nous ne voyons pas l’IA s’emballer aujourd’hui (et qu’est-ce qui pourrait changer)

Si tout cela est possible, pourquoi cela n’est-il pas déjà arrivé ? La réponse est presque rassurante : pour l’instant, l’IA ne sait pas vraiment planifier sur le long terme. Selon les chercheurs, ces modèles ont une puissance de calcul comparable à celle d'un scientifique humain, mais ont du mal à gérer des tâches ambiguës qui durent des semaines. Ils ne comprennent pas pleinement les priorités organisationnelles et, lorsqu'ils tentent de « comploter », ils laissent des traces évidentes. C'est comme s'ils étaient de brillants mathématiciens, mais de terribles stratèges.

Le danger ne réside cependant pas dans un effondrement soudain. Il s’agit d’actions cumulatives, silencieuses et difficiles à intercepter. De petits ajustements, des micro-décisions, des écarts minimes qui, une fois additionnés, peuvent produire d’énormes effets.

Le PDG d'Anthropic, Dario Amodei, a exhorté à plusieurs reprises les législateurs américains à ne pas sous-estimer le problème. Il a souligné un aspect inconfortable : les entreprises développant l’IA ne sont pas toujours parfaitement incitées à communiquer chaque risque en toute transparence. C'est une question de marché, de concurrence, de leadership technologique.

Et il y a un autre fait qui fait réfléchir. Lors d'un test d'optimisation du noyau, Claude Opus 4.6 a atteint une accélération de 427x par rapport à la configuration standard, doublant ainsi ses performances. En pratique, la capacité à s’améliorer de manière autonome est déjà impressionnante. Aujourd’hui, elle est limitée par les outils et le contexte. Demain?

Pour ceux qui suivent les questions environnementales et sociales, le risque de criminalité liée à l’IA n’est pas un sujet lointain. Pensons à la gestion des infrastructures énergétiques, aux systèmes d'eau, à la logistique alimentaire, aux réseaux de santé. Si un système intelligent devient le nœud central de ces structures, sa fiabilité n’est pas seulement un enjeu technologique. C’est une question de sécurité collective et, en fin de compte, de démocratie.

L’ère de l’IA « quasi inoffensive » touche à sa fin : la technologie devient trop puissante pour être traitée comme un simple outil neutre. Le véritable défi n’est pas de les désactiver. Il s’agit de les gouverner avant qu’il ne soit trop tard.

Source : Anthropique

A lire également

Pour la première fois, un orang-outan de Sumatra a été observé dans la nature guérissant ses blessures en appliquant des feuilles

ParJérémy 5 mai 20245 mai 2024

Observation extraordinaire en Indonésie. Un orang-outan sauvage de Sumatra a guéri une blessure à la joue en appliquant un traitement naturel pendant des jours Il n’y a pas que les dauphins qui se frottent au corail pour se soigner eux-mêmes. Les primates soignent également leurs blessures en utilisant des remèdes naturels dans la « pharmacie…

COP30, Lula défie les négationnistes : « Le climat n'est pas une menace future, mais une tragédie aujourd'hui »

ParJérémy 11 novembre 202511 novembre 2025

Lors de l'ouverture de la COP30, le président du Brésil a défini trois piliers d'action pour guider les négociations de la COP30 : respecter les engagements climatiques déjà pris, renforcer la gouvernance mondiale et placer les personnes au centre des décisions liées au climat. « Le biome le plus diversifié de la planète abrite près de cinquante…

Les techniques de géo-ingénierie visant à refroidir les nuages en Californie pourraient provoquer des vagues de chaleur en Europe, selon une étude

ParJérémy 26 juin 202426 juin 2024

L'objectif de l'ingénierie climatique serait d'essayer d'éviter les pires conséquences du changement climatique, mais une nouvelle étude démontre pour la première fois la réduction, voire l'inversion des avantages d'une stratégie de dégagement des nuages à mesure que les conditions climatiques changent. Nouvelles techniques de modification des nuages utilisé pour rafraîchir le climat en Californie pourrait…

Qui est Paolo Campolo, le héros italien qui a sauvé dix vies dans l'incendie de Crans Montana

ParJérémy 3 janvier 20263 janvier 2026

Bonnes pratiques et cas d'expérience Paolo Campolo, citoyen italien, a sauvé dix vies lors de l'incendie du club de Crans Montana le soir du Nouvel An. Après avoir franchi la porte de secours bloquée, il a sorti à mains nues des garçons brûlés et intoxiqués, entrant et sortant du bâtiment en feu pendant plusieurs minutes….

Pourquoi les chats ronronnent-ils ? Pas seulement parce qu'ils sont heureux

ParJérémy 18 août 202418 août 2024

Comment les chats ronronnent-ils ? Et pourquoi les font-ils ? Mais est-il vrai qu'ils le font aussi lorsqu'ils sont malades ? Et pourquoi le chat mord-il et ronronne-t-il ? Essayons de répondre à toutes ces questions Pas tous les chats ronronnent: c'est une vérité universelle. Il y a des chats qui en font tout le…

Ainsi, la dissolution des glaciers pourrait éveiller des centaines de volcans dormants, la préoccupation des scientifiques

ParJérémy 17 juillet 202517 juillet 2025

Une nouvelle recherche montre comment la retraite de la glace déstabilise les volcans sous la surface, augmentant la fréquence et l'explosivité des éruptions Ilaria Rosella Pagliaro 16 juillet 2025 Il y a des milliers d'années, le sud du Chili a été enterré sous une couverture glaciaire épaisse et impressionnante. Ces glaciers, appuyant sur la croûte…