Menu

Aucun menu défini dans le customizer.

Un ingénieur de Netflix crée une appli pour alléger ses factures d’IA, puis l’ouvre à tout le monde

Tejas Chopra, ingénieur senior chez Netflix, a bricolé un petit logiciel appelé
Headroom
qui s’attaque à un poste de dépense devenu douloureux dans toutes les boîtes qui carburent à l’IA : la facture en tokens, ces unités que les modèles de langage facturent au passage et qui correspondent en gros à des morceaux de mots.

Son constat de départ est sévère. Près de 90% de ce qu’on balance à un grand modèle de langage, le type d’IA qui fait tourner ChatGPT, serait selon lui de la redondance pure, du remplissage que la machine paie au prix fort sans en tirer la moindre valeur.

Instagram – Le chatbot de Meta donnait les clés des comptes

Le support de Meta, quand vous contactez Instagram pour un souci de compte, c’est 100% IA maintenant. Je l’ai fait y’a pas longtemps et c’est assez surprenant, même s’il faut le reconnaitre, ça fonctionne bien. Et si je vous parle de ça ce matin, c’est que pendant des semaines, ce chatbot a refilé l’accès à des comptes à qui savait lui raconter la bonne histoire.

Et c’est pas un exploit de génie ni une faille bien planquée mais juste un bot de support trop serviable à qui on explique qu’on s’est fait pirater, et qui envoie le code de réinitialisation… sur l’adresse mail de l’attaquant. Oui, il est aussi précautionneux de vos accès que votre gardien d’immeuble ^^.

Dynamic Workflows – Quand Claude Code orchestre des centaines d’agents

Faut le reconnaître, malgré toute la bonne volonté qu’elle peut y mettre, y’a encore des tâches trop grosses pour être réalisées en une seule passe avec de l’IA, du genre auditer votre projet de Saas en mousse en intégralité ou traiter les milliers de fichiers que vous récupérez sur le darkweb (ça va, j’rigole mes petits Pablo). Hé bien c’est exactement ce que les
dynamic workflows
d’Anthropic, sortis hier avec Opus 4.8 dans Claude Code, viennent régler.

Dynamic Workflows – Quand Claude Code orchestre des centaines d’agents

Faut le reconnaître, malgré toute la bonne volonté qu’elle peut y mettre, y’a encore des tâches trop grosses pour être réalisées en une seule passe avec de l’IA, du genre auditer votre projet de Saas en mousse en intégralité ou traiter les milliers de fichiers que vous récupérez sur le darkweb (ça va, j’rigole mes petits Pablo). Hé bien c’est exactement ce que les
dynamic workflows
d’Anthropic, sortis hier avec Opus 4.8 dans Claude Code, viennent régler.

Dynamic Workflows – Quand Claude Code orchestre des centaines d’agents

Faut le reconnaitre, malgré toute la bonne volonté qu’elle peut y mettre, y’a encore des tâches trop grosses pour être réalisée en une seule passe avec de l’IA, du genre auditer votre projet de Saas en mousse en intégralité ou traiter les milliers de fichiers que vous récupérez sur le darkweb (ça va, j’rigole mes petits Pablo). Hé bien c’est exactement ce que les
dynamic workflows
d’Anthropic, sortis hier avec Opus 4.8 dans Claude Code, viennent régler.

Pax Historia – Le jeu IA qui vous laisse réécrire l’Histoire

C’est mon plus jeune fils qui m’a fait découvrir ça un soir, et comme j’ai trouvé ça top, bah je vous en parle. C’est un jeu web nommé
Pax Historia
et ça a été créé par deux colocataires de fac, Eli Bullock-Papa et Ryan Zhang, sur un coin de table durant un hackathon. Et ce n’est ni plus ni moins qu’un bac à sable d’histoire alternative où c’est une IA qui fait vivre le monde autour de vous, un peu comme à son époque, ”
Un monde meilleur
” de FibreTigre.

WordPress Workspace – L’agent IA d’Automattic

Si comme moi, vous bloguez encore à l’ancienne, c’est à dire depuis l’interface web de WordPress.com, sachez qu’Automattic vient de balancer une app pour Mac qui s’est donné pour mission de vraiment bousculer votre façon d’écrire.

WordPress Workspace
est donc un éditeur de site, un agent IA, un outil de prise de note… Bref, un outil fourre-tout qui est en réalité un agent IA branché sur votre contenu et capable aussi d’uploader des médias vers la médiathèque de votre site. Ça se présente donc comme un chat auquel on peut demander tout et n’importe quoi, du style “Voici mon article [TEXTE]. Publie le” ou encore “”J’ai la flemme, écris moi un article sur ça : [SUJET]“.

Lemonade – L’IA locale sur NPU AMD, GPU et Mac

Vous n’avez pas de Mac Silicon, mais vous avez vu passer
mon article de ce matin sur vLLM-MLX
et son serveur d’IA local ? Hé bien bonne nouvelle, je suis tombé ce midi sur
Lemonade SDK
, un serveur d’IA local communautaire sponsorisé par AMD (et largement codé par leurs ingénieurs), qui joue dans la même cour, mais côté PC + Mac !

C’est la même logique qu’avec vLLM-MLX, vous installez le serveur (un paquet clé en main selon votre OS, pas de bidouille pip), et il expose un endpoint compatible API OpenAI sur http://localhost:13305/api/v1. Vos scripts tapent dessus au lieu d’envoyer vos prompts, et votre pognon, chez OpenAI.

vLLM-MLX – Pour remplacer l’API d’OpenAI par votre propre Mac

Si vous avez un Mac avec une puce Silicon et que vous en avez marre de raquer pour des tokens à chaque requête API à un LLM à la con, y’a un projet qui mérite, je trouve, le détour. Ça s’appelle
vLLM-MLX
, et c’est un serveur d’inférence local qui transforme votre Mac en machine à générer du texte, à analyser des images et vidéos, et même capable de gérer de l’audio… et tout ça sans que l’inférence ne passe par le cloud des zaméricains.

Rocky – Le pote alien de Projet Dernière Chance débarque sur Raspberry Pi

J’sais pas si vous avez vu le film ou lu le livre mais Rocky, c’est l’araignée de roche extraterrestre de Projet Dernière Chance (Project Hail Mary) qui communique en chantant. Et Lahiru Maramba, un dev Firebase en poste chez Google, vient de le recréer en vrai avec un Raspberry Pi Zero 2W et un LLM local. Et voilà comme avoir un vrai pote Eridien posé sur votre bureau, qui vous répond en accords polyphoniques au lieu de parler.