Menu

Aucun menu défini dans le customizer.

OpenAI met à jour son Agents SDK avec du sandboxing natif

La mise à jour d’avril du SDK Agents d’OpenAI introduit deux nouvelles briques qui manquaient pour passer de l’agent-jouet au déploiement réel. Le sandboxing natif permet de confiner un agent dans un espace de travail isolé, avec accès limité aux fichiers et outils d’un périmètre défini. Et le nouveau harness d’exécution sépare proprement le plan de contrôle (boucle agent, appels modèle, routing d’outils, approbations, tracing, récupération d’erreurs) du plan de calcul (sandbox où l’agent lit, écrit, exécute du code, installe des dépendances, snapshot son état).

AIDGE – Du deep learning sur vos microcontrôleurs

L’IA embarquée, c’est pas juste un buzzword de salon type CES. C’est vraiment ce qui fait que votre voiture freine toute seule, que votre drone évite les arbres et que votre prothèse auditive filtre le bruit en temps réel. Sauf que pour déployer un réseau de neurones sur un microcontrôleur de 256 Ko de RAM… bah on dépend quasi exclusivement de frameworks américains ou chinois.

Un peu gênant, non ?

Du coup, le CEA (oui, le Commissariat à l’énergie atomique, celui de Palaiseau) a décidé de s’y coller avec
AIDGE
, un framework open source dédié à l’IA embarquée qui est hébergé par la fondation Eclipse. En gros, vous prenez votre modèle de deep learning entraîné sous PyTorch ou importé en ONNX, et AIDGE se charge de l’optimiser puis de générer du code C/C++ standalone prêt à tourner sur votre cible matérielle. Pas du pseudo-code donc mais du vrai C++ compilable.

Le VLIW, cette architecture de processeur “impossible” qui revient par la porte de l’IA

La
chaîne YouTube Asianometry
vient de publier une vidéo qui retrace l’histoire du VLIW, une architecture de processeur née dans les années 80 et longtemps considérée comme un échec. Sauf que cette technologie, enterrée avec l’Itanium d’Intel, refait surface dans les puces dédiées à l’intelligence artificielle. Et elle est peut-être déjà dans votre smartphone.

Le principe, et c’est un peu technique

Si vous ne connaissez pas Asianometry, c’est une chaîne qui décortique l’histoire des semi-conducteurs avec un vrai talent de vulgarisation, et cette vidéo sur le VLIW (pour Very Long Instruction Word) ne fait pas exception.

TurboQuant – Un LLM de 104B sur un MacBook, merci Google

Vous faites tourner des LLMs en local comme le gros fifou de Hipster IA que vous êtes et, Ô drame, la VRAM de votre ordinateur explose dès que le contexte dépasse 8000 pauvres malheureux tokens ?

Le problème c’est le KV cache les amis ! Le KV cache c’est ce truc qui stocke les clés et valeurs d’attention et qui grossit linéairement avec la longueur du prompt. C’est pour gérer ce problème que Google a annoncé sous la forme d’un whitepaper uniquement un algo qui compresse tout ça de 3,8 à 6,4 fois… et youpi pour nous, y’a un dev qui l’a déjà implémenté dans
un fork de llama.cpp
.

Reverse-SynthID – Le filigrane de Gemini mis à nu

SynthID, le filigrane invisible que Google injecte dans chaque image Gemini, c’était censé être incassable. Sauf qu’un dev a eu l’idée toute bête de générer des images noires et blanches avec Gemini, puis de regarder ce qui restait dans le domaine fréquentiel. Et là, surprise… le watermark est apparu en clair avec toutes ses fréquences porteuses !

Le projet
reverse-SynthID
documente le truc de A à Z où on comprend en gros, que le marquage IA de Google fonctionne en injectant de l’énergie à des fréquences bien précises dans le spectre de l’image via une
transformation de Fourier
. Le chercheur a identifié 6 fréquences porteuses principales, toutes avec une cohérence de phase supérieure à 99,9% et la blague, c’est que ce pattern est fixe. Donc pas de message unique par image, pas de clé qui change… c’est juste la même empreinte spectrale sur toutes les images sorties du modèle Gemini.

Un agent IA a mené 700 expériences en deux jours pour améliorer un modèle de langage

Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l’IA chez Tesla, a laissé tourner un agent IA pendant 48 heures sur un petit modèle de langage. Résultat : 700 expériences, 20 optimisations retenues et un gain de 11 % sur le temps d’entraînement.

Le principe d’autoresearch

Mais c’est quoi ce concept d’autoresearch ? Et bien le fonctionnement est assez direct : un agent IA reçoit un script d’entraînement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par expérience sur un seul GPU. Et c’est là que l’agent se met en mouvement pour lire le code, formuler une hypothèse, modifier le script, lancer l’entraînement, évaluer le résultat, et surtout décider, ou non, de conserver une modification.

Claude Octopus – Faites débattre 3 IA sur votre code

Claude Octopus
, c’est un plugin Claude Code qui fait bosser trois IA ensemble sur le même problème. Codex pour l’implémentation, Gemini pour la recherche, Claude pour la synthèse, le tout avec un seuil de qualité à 75% qui bloque ce qui n’est pas au niveau.

En gros, au lieu de faire confiance à un seul modèle GPT ou Gemini, vous en mettez trois en parallèle et le plugin ne valide que si les résultats des trois moteurs convergent suffisamment.

Comma 4 + openpilot 0.11 – La conduite assistée open source passe un cap

Vous vous souvenez quand je vous parlais de
Geohot et de sa voiture autonome en 2015
? Le mec bidouillait une Acura avec des caméras à 13 balles et rêvait de vendre son kit à 1000 balles. Hé bien 10 ans plus tard, c’est fait ! Et si je vous reparle de ça aujourd’hui, c’est parce que sa société
comma.ai
sort la
v0.11
d’
openpilot
ainsi qu’un nouveau boîtier qui tient dans la main, le Comma 4 !

Google lance une IA pour traquer les bugs dans le noyau Linux

Google vient de rendre public Sashiko, un outil de revue de code par intelligence artificielle qui analyse automatiquement les correctifs soumis au noyau Linux. Sur un échantillon de 1 000 bugs récents, l’IA en a détecté 53 %, alors que les relecteurs humains les avaient tous ratés sans exception.

Comment fonctionne Sashiko

Sashiko a été développé en interne par l’équipe Linux de Google, sous la direction de Roman Gushchin. Le principe : chaque correctif envoyé sur la liste de diffusion du noyau Linux est automatiquement analysé par une IA qui cherche les erreurs, les incohérences et les bugs potentiels.

Fast SAM 3D Body – Quand l’IA scanne votre corps en 3D en 65ms

Vous prenez une photo de quelqu’un avec votre téléphone et magie magie, en une fraction de seconde, vous obtenez un modèle 3D complet de son corps. Ses bras, ses jambes, ses mains, ses pieds… tout y est, modélisé en 3D comme si vous aviez un vrai studio de motion capture à Hollywood.

Et ben c’est exactement ce que fait
SAM 3D Body
, un modèle d’IA développé par Meta.

En gros, vous lui filez une image de vous et l’IA reconstruit votre corps en volume, avec le squelette, les articulations et la surface de la peau. Jusqu’ici, ce genre de techno existait déjà mais c’était hyper lent, genre plusieurs secondes par image. Donc pas top si vous vouliez que ça suive, par exemple, vos mouvements en direct.