Menu

Aucun menu défini dans le customizer.

ShadowPrompt – N’importe quel site pouvait abuser votre extension Claude

Une faille découverte dans l’extension Chrome de Claude permettait à n’importe quel site web d’injecter silencieusement des prompts dans votre assistant IA. Pas besoin de cliquer, pas besoin de permission… non, fallait juste visiter une page web et c’était réglé. Le chercheur Oren Yomtov de
Koi Security
à l’origine de cette découverte, a baptisé ça “ShadowPrompt” et vous allez voir, c’est dingue.

En fait, cette attaque enchaînait deux failles. La première, c’est que l’extension acceptait les messages de n’importe quel sous-domaine en *.claude.ai, car Anthropic avait mis en place un allowlist trop permissif. Sauf qu’Arkose Labs, le fournisseur de CAPTCHA, hébergeait un composant sur a-cdn.claude.ai et malheureusement, ce composant contenait une jolie faille XSS bien classique. Celui-ci acceptait les postMessage sans vérifier l’origine, et le texte reçu était ainsi injectable via un
dangerouslySetInnerHTML
. Donc y’a bien ZERO validation côté client. Ouééééé !

Le piratage par IA n’a plus besoin de malware : une simple doc suffit

Une nouvelle méthode d’attaque cible les IA de développement comme Copilot. En publiant de la documentation empoisonnée, des hackers trompent les modèles pour qu’ils recommandent des bibliothèques malveillantes. Cette menace invisible pour la sécurité est indétectable par les outils classiques.

Le concept est d’une simplicité désarmante. Plus besoin d’injecter du code malicieux dans un dépôt GitHub ou de trouver une faille zero-day complexe. Il suffit désormais de publier de la documentation technique faussée sur des forums, des wikis ou des fichiers README publics. Ces textes, une fois ingérés par les grands modèles de langage (LLM), deviennent une source de vérité pour l’IA qui assiste les développeurs au quotidien.

Dire à une IA qu’elle est experte la rend moins performante

Des chercheurs de l’université de Californie du Sud viennent de publier une étude improbable : demander à un modèle d’IA de jouer les experts dégrade ses performances sur les tâches factuelles. Commencer un prompt par “Tu es un expert en programmation” produit de moins bons résultats que de poser la question directement.

Le piège du “tu es un expert”

L’étude, intitulée “Expert Personas Improve LLM Alignment but Damage Accuracy”, a mesuré l’impact des instructions de rôle sur les réponses des modèles de langage.

QMD – Un moteur de recherche local pour vos notes Markdown

Si vous êtes comme votre blogueur préféré (hi hi) et que vous avez des tonnes de fichiers markdown qui traînent dans des dossiers obscurs depuis des années, voici l’outil parfait pour rendre tout ceci à nouveau utilisable dans la vraie vie.

En tout cas, c’est plus pratique qu’un grep !

Ça s’appelle QMD (Quick Markdown Search) et c’est un outil en ligne de commande dispo sur GitHub qui va indexer tout votre bazar de notes pour les rendre consultables rapidement. QMD combine la recherche plein texte classique (BM25) avec de la recherche vectorielle sémantique et du re-ranking via LLM, ce qui veut dire que c’est ultra puissant. On est un peu sur le même principe qu’un RAG en fait puisque l’IA locale est utilisée pour comprendre le sens de votre requête et pas juste chercher des chaînes de caractères bêtes et méchantes. J’utilise depuis un petit moment maintenant un système similaire avec
LEANN
pour indexer tous les articles de korben.info et retrouver des connexions entre mes contenus, et je peux vous dire que quand on goûte à la recherche sémantique, le bon vieux grep a un goût de carton.

Voicebox – Clonez des voix en local sans passer par le cloud

Si vous cherchez un moyen de faire du clonage vocal en local sans filer vos fichiers audio à un service cloud,
Voicebox
devrait vous plaire. C’est un studio de
synthèse vocale
open source et gratuit qui tourne entièrement sur votre machine, et qui n’a rien à envier à ElevenLabs.

Concrètement, vous téléchargez l’app (dispo macOS, Windows et Docker), vous importez un extrait audio d’à peine 3 secondes minimum et hop, la voix est clonée. Pas besoin de compte, pas de limite d’utilisation, pas de “crédits” qui fondent comme neige au soleil !

ChatGPT leur a coûté 200 000 dollars, ils ont créé leur propre IA pour corriger le tir

Une startup spécialisée dans le dessalement de l’eau a perdu 200 000 dollars et quatre mois de recherche après avoir fait confiance à ChatGPT et Grok pour un choix de matériaux. Du coup, l’équipe a développé Rozum, un moteur de raisonnement qui fait tourner plusieurs modèles d’IA en parallèle et vérifie leurs réponses avant de les livrer.

Une erreur qui a fait très mal

L’histoire commence chez Waterline Development, une entreprise californienne qui travaille sur la désalinisation de l’eau. L’équipe devait choisir entre deux types d’électrodes en carbone pour son procédé. Elle a demandé à ChatGPT et à Grok de l’aider à trancher. Les deux modèles ont recommandé le tissu de carbone. Sauf que ce choix était le mauvais : mauvaise conductivité, problèmes de rétention d’eau, durabilité insuffisante. Derek Bednarski, le fondateur (passé par Tesla pendant huit ans), résume la situation : les modèles se sont trompés avec aplomb, et ça leur a coûté quatre mois et 200 000 dollars.

Peon Ping – Donnez de la voix à vos agents IA

Something need doing ?” Si cette réplique vous file un frisson nostalgique, alors vous allez adorer
Peon Ping
!!

Il s’agit d’un outil CLI open source qui joue des voix de personnages de jeux vidéo quand vos agents IA ont besoin de votre attention. Vous lancez Claude Code, vous passez sur autre chose, et le moment venu, un peon de Warcraft III vous gueule “Work complete!” quand c’est terminé.

Concrètement, ce truc s’intercale via des hooks entre vous et votre IDE, comme ça, chaque événement (démarrage de session, fin de tâche, erreur, demande de permission) déclenche une réplique différente. Du coup le peon dit “Something need doing?” quand l’agent attend un input, et “I can’t do that!” quand y’a une erreur.

Promptfoo – Fini le doigt mouillé pour tester vos LLM

Si vous utilisez des LLM dans vos projets, vous savez que le plus flippant c’est pas de les faire fonctionner (quoique..lol) mais c’est de vérifier qu’ils ne disent pas n’importe nawak ! Et pour cela, il y a
Promptfoo
, un outil CLI open source qui permet de tester vos prompts, comparer les modèles et scanner les vulnérabilités de vos apps IA, le tout avec un simple fichier YAML.

Ça s’installe en une commande (npx promptfoo@latest init) et vous voilà avec un fichier promptfooconfig.yaml où vous définissez vos prompts, les modèles à tester et les assertions à vérifier.

Conductor – Lancez des agents IA en parallèle sur votre code

Conductor
c’est une app macOS qui vous permet de lancer plusieurs agents Claude Code ou Codex en parallèle, chacun dans son propre worktree git histoire qu’ils ne se marchent pas dessus. Le tout est développé par Melty Labs, et c’est gratuit !! (enfin l’app en elle-même, parce que les tokens Claude ou OpenAI, c’est vous qui casquez hein ^^).

Vous ouvrez l’app, Cmd+N pour créer un workspace, et ensuite, chaque agent bosse dans son coin sur sa propre branche git comme ça y’a pas de conflits ni de merge foireux au milieu du boulot ! Et grâce à cet outil, vous voyez d’un coup d’oeil ce que chacun fabrique via le diff viewer intégré. Ensuite, vous reviewez, et quand c’est bon vous mergez. Comme un chef de chantier en fait, sauf que vos ouvriers ce sont des LLM.

Vous n’arrivez pas à finir un jeu ? Microsoft va le finir pour vous

Microsoft vient de publier un brevet qui décrit un système capable d’envoyer une IA ou un autre joueur prendre le contrôle de votre partie quand vous êtes bloqué. Sony travaille sur une idée similaire de son côté. Visiblement les deux géants du jeu vidéo veulent que vous ne restiez plus jamais coincé sur un boss, même si ça veut dire que quelqu’un d’autre joue à votre place.

Un assistant qui prend la manette

On est donc là devant un brevet plutôt intéressant qui porte le doux nom de “Video Game Help Sessions”, il a été déposé en février 2024, et vient à peine d’être publié. Le principe est assez simple : quand le système détecte que vous galérez un peu trop sur un passage, un gros bouton HELP apparaît à l’écran.