Age of LLM – Un Age of Empires où aucun humain ne joue
Vous voulez savoir comment GPT-5.5, Claude ou Grok raisonnent quand on les met sous pression ? Hé bien filez-leur un jeu de stratégie et regardez-les se faire la guerre.
C’est tout le principe d’
Age of LLM
, monté par Rymentz, un lecteur du blog où deux IA s’affrontent au tour par tour, sans aucun humain aux commandes.
C’est un benchmark 1v1 dans lequel on balance deux modèles sur la même carte, on leur donne les règles et puis c’est tout, sans aucun autre conseil de stratégie. À eux alors de déduire seuls comment contrer les attaques, quand bâtir leur économie, quand lever une armée pour aller défoncer la base d’en face, quand négocier la paix et quand carrément appuyer sur le gros bouton rouge. Parce que dans ce benchmark, on peut gagner de trois façons : la conquête militaire, la victoire diplomatique, ou la bombe nucléaire.
