Anthropic met entre toutes les mains un modèle qu’elle jugeait trop dangereux à publier il y a deux mois
Voilà autre chose dites donc. En avril, Anthropic, le concurrent direct d’OpenAI et créateur de l’assistant Claude, dévoilait Mythos, un modèle d’intelligence artificielle tellement doué pour dénicher et exploiter des failles informatiques que l’entreprise avait préféré ne pas le diffuser. Il restait réservé à une poignée d’organisations de cyberdéfense triées sur le volet.
Deux mois plus tard, ce même moteur arrive chez le grand public sous le nom de Claude Fable 5.
C’est exactement le modèle de Mythos en dessous, avec des limites posées par-dessus. Anthropic ne s’en cache pas : Fable 5 dépasse tout ce qu’elle a publié jusqu’ici, son propre Claude Opus 4.8 compris, et ses tests internes le placent devant le GPT-5.5 d’OpenAI comme devant le Gemini 3.1 Pro de Google. Le modèle parvient même à terminer Pokémon FireRed en se contentant de regarder l’écran défiler.
Pour éviter les dérapages, trois classifieurs, des programmes qui surveillent en continu ce que vous tapez, passent chaque conversation au crible. Dès qu’une requête touche à la cybersécurité offensive, à la biologie ou à la chimie sensibles, la réponse est refilée à Claude Opus 4.8, nettement moins à l’aise sur ces terrains piégeux.
Anthropic assure que ce garde-fou se déclenche sur moins de 5% des sessions, et qu’un programme de chasse aux failles de plus de 1 000 heures n’a débouché sur aucun contournement universel.
Il y a quand même une contrepartie qui pique. Toutes les conversations avec Fable 5 sont conservées 30 jours, y compris pour les entreprises qui avaient pourtant signé des accords de rétention zéro, autrement dit la garantie écrite qu’aucune de leurs données ne serait gardée. Officiellement, c’est pour repérer les attaques inédites.
Côté porte-monnaie, le modèle est gratuit pour les abonnés Pro, Max, Team et Enterprise jusqu’au 22 juin, après quoi il faudra des crédits d’utilisation. Pour les développeurs qui le branchent à leurs applications, comptez 10 dollars par million de mots traités en entrée et 50 dollars en sortie, soit le double du tarif d’Opus 4.8.
Quelques jours avant cette sortie, Anthropic réclamait publiquement une “pédale de frein coordonnée” sur les modèles les plus avancés, en agitant le risque d’une IA capable de se perfectionner toute seule.
Bref, on prêche la prudence le lundi et on ouvre les vannes le jeudi. La logique commerciale a visiblement gagné l’arbitrage.
Source :
Anthropic

Leave a Comment