Menu

Aucun menu défini dans le customizer.

Actus AutomatiséesActus TechAI

Why we no longer evaluate SWE-bench Verified

Actualités Automatisées

Why we no longer evaluate SWE-bench Verified

🕒 Publié le : 23/02/2026 à 18:14
 |  ✍️ Auteur :
 |  📚 Source : OpenAI News

SWE-bench Verified is increasingly contaminated and mismeasures frontier coding progress. Our analysis shows flawed tests and training leakage. We recommend SWE-bench Pro.
Avatar de Krigs

À propos de l'auteur

https://github.com/Krigsexe

Voir tous les articles de Krigs

Leave a Comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Profil Gravatar