Google lance un tournoi d'échecs entre les différents modèles IA pour évaluer les différentes capacités de raisonnement de Chatgpt, Gemini et Co.
De Chatgpt aux Gemini, Otto AI se défie mutuellement dans un tournoi d'échecs sur Kagger: le projet, en collaboration avec Google Deepmind, montre comment ces technologies « pensent » et prennent des décisions dans le jeu le plus stratégique qui existe
Kaggle, en collaboration avec Google Deepmind, vient de lancer Game Arena, une nouvelle plate-forme conçue pour mieux comprendre comment les intelligences artificielles pensent. Pour inaugurer le projet, un tournoi d'échecs entre l'IA est tenu du 5 au 7 août 2025, il présente certains des modèles linguistiques les plus avancés au monde, notamment Chatgpt, Gemini, Claude et autres.
Il s'agit d'un défi d'élimination directe, où l'IA fait face à un contre un. Contrairement à d'autres systèmes créés uniquement pour jouer, ces modèles sont des généralistes, conçus pour écrire des textes, programmer, résoudre des problèmes. Et maintenant, ils essaient de jouer aux échecs.
Les participants au tournoi
Pour rivaliser sur les échecs, il y aura huit modèles d'IA développés par certaines des réalités les plus puissantes dans le domaine de l'intelligence artificielle:
- Gemini 2.5 Pro (Google)
- Gemini 2.5 Flash (Google)
- O3 (OpenII)
- O4-MinI (OpenII)
- Claude 4 Opus (anthropic)
- Grok 4 (Xai, Elon Musk's Company)
- Deepseek R1
- Kimi K2 (Moonshot Ai)
Pour dire au tournoi au public, il y aura des visages bien connus dans le monde des échecs en ligne:
- Le GM Hikaru Nakamura se déroulera chaque jour en direct sur Twitch.
- L'IM Levy Rozman, connu sous le nom de Gothamchess, fera une analyse quotidienne sur sa chaîne YouTube.
- Enfin, Magnus Carlsen, un ancien champion du monde, proposera un dernier commentaire sur le site Web Take Take, partenaire officiel de l'initiative.
Le classement sera mis à jour en temps réel sur Kaggle, dans le style ELO, il sera donc facile de comprendre quelle IA est vraiment la plus forte dans le jeu des échecs.
Ceux-ci ne sont pas nés pour jouer. Ils ne sont pas comme Alphazero, le système Google DeepMind qui a fait l'histoire en 2017 en battant le moteur Stockfish, l'un des plus forts de tous les temps. Alphazer a appris seul à jouer, simplement en jouant des millions de matchs contre lui-même. Mais il n'a jamais été rendu public.
Les modèles que nous verrons sur le terrain dans le tournoi Kagger, en revanche, sont des généralistes: ils savent écrire, répondre aux questions, générer du code, mais faire souvent des erreurs d'échecs. Certains d'entre eux font des mouvements illégaux ou se rendent sans raison.
La chose intéressante, cependant, est que celles-ci sont capables d'expliquer pourquoi elles font un certain pas. Selon Google, cette fonctionnalité aide à vraiment comprendre comment fonctionne leur façon de penser, allant au-delà du simple score d'un jeu. Kagger se concentre sur ceci: rendre visible l'évolution de la pensée stratégique de l'IA.
Échecs aujourd'hui, simulations complexes demain
Game Arena ne s'arrêtera pas aux jeux de société. Kagger, détenue par Google, prévoit d'étendre la plate-forme à des environnements simulés, à des jeux multijoueurs et à des scénarios réalistes. Tout sera ouvert, accessible et conçu pour aider les développeurs et les chercheurs à comprendre comment ils se comportent et s'adaptent à l'IA dans différents contextes.
Pour l'instant, cependant, les projecteurs sont axés sur les échecs. Et même si aucun de ces modèles n'atteint encore le niveau d'un maître humain expert, le défi est fascinant. Parce que cela nous permet d'observer de près la façon dont une voiture prend des décisions, manquent, apprend et s'adapte. Et cela s'applique plus qu'une victoire sur les échecs.
Source: Kaggle
