Menu

Aucun menu défini dans le customizer.

notebooklm-py – L’API Python que Google refuse de sortir

Google n’a jamais sorti d’API publique pour
NotebookLM
, son outil qui transforme vos documents en podcasts, quiz et autres résumés grâce à l’IA. Pas de SDK, pas de CLI, y’a rien du tout alors on est tous triiiiiste. A peine juste une interface web avec ses boutons moches et ses menus déroulants, mais impossible à scripter ou à intégrer dans le moindre pipeline bash.

Mais un dev bien inspiré a reverse-engineeré les endpoints REST internes et a pondu notebooklm-py, une lib Python de 168 Ko qui fait tout ce que le web UI refuse de faire. Franchement, c’était pas trop tôt ! Vous en avez rêvé, lui l’a fait !

OpenRAG – Le RAG clé en main qui vous évite 3 jours de galère

Monter un pipeline RAG, c’est un peu le parcours du combattant… entre le choix de la base vectorielle, le modèle d’embedding, l’orchestrateur, le parser de documents, vous en avez pour des heures de config avant de pouvoir poser la moindre question à vos PDF.

Mais c’était sans compter sur
OpenRAG
qui emballe tout ça dans un seul paquet prêt à l’emploi !

En gros, c’est un package open source (Apache 2.0) qui vous colle un orchestrateur visuel, un moteur de recherche vectorielle et un parser de documents hyper costaud, le tout déjà branché ensemble. Bon, dit comme ça, on dirait juste un assemblage de trucs existants… sauf que l’architecture est propre (FastAPI derrière, Next.js devant) et que tout est câblé d’entrée.

OpenRAG – Le RAG clé en main qui vous évite 3 jours de galère

Monter un pipeline RAG, c’est un peu le parcours du combattant… entre le choix de la base vectorielle, le modèle d’embedding, l’orchestrateur, le parser de documents, vous en avez pour des heures de config avant de pouvoir poser la moindre question à vos PDF.

Mais c’était sans compter sur
OpenRAG
qui emballe tout ça dans un seul paquet prêt à l’emploi !

En gros, c’est un package open source (Apache 2.0) qui vous colle un orchestrateur visuel, un moteur de recherche vectorielle et un parser de documents hyper costaud, le tout déjà branché ensemble. Bon, dit comme ça, on dirait juste un assemblage de trucs existants… sauf que l’architecture est propre (FastAPI derrière, Next.js devant) et que tout est câblé d’entrée.

LiteRT – L’IA embarquée de Google passe la seconde

TensorFlow Lite, c’est fini. Enfin presque car Google a rebrandé dernièrement son framework d’inférence embarquée sous le nom de
LiteRT
, et en a profité pour refaire pas mal de choses sous le capot.

Rassurez-vous mes petits prompts engineers (lol), le principe reste le même à savoir faire tourner des modèles de machine learning directement sur votre smartphone, votre tablette ou votre Raspberry Pi, sans envoyer vos données dans le cloud. Sauf que cette fois, y’a une nouvelle API baptisée Compiled Model qui change la donne car, en fait, l’ancien système vous obligeait à choisir manuellement votre accélérateur.

MLX-Audio – Faites parler votre Mac sans le cloud

Faire de la
synthèse vocale
, de la transcription et du voice cloning en local sur son Mac, sans envoyer le moindre octet dans le cloud… hey bien c’est possible mes petits foufous et en plus comme je sais que vous avez des oursins dans les poches, hé bien bonne nouvelle : C’est gratuit !

MLX-Audio
, c’est donc une bibliothèque Python qui exploite le framework MLX d’Apple pour faire tourner des modèles audio directement sur les puces M1, M2, M3, M4 et maintenant M5. Cette liste est trop longue, la prochaine fois, j’écrirais M* ou M1-5 ^^. Avec cette lib, du coup, tout se fait en local sur votre machine. Si je devais oser une comparaison un peu casse gueule, je dirais que c’est un peu le Ollama de l’audio.

no-agents.md – Le fichier qui dit non aux IA dans votre code

AGENTS.md, c’est un standard émergent que les agents IA comme Copilot, Codex ou
Jules
lisent avant de toucher à votre code. Plus de 60 000 projets open source l’utilisent déjà pour guider ces agents dans leur repo et y’a un développeur qui a eu l’idée géniale de retourner ce truc contre eux.

Ross A. Baker a créé
no-agents.md
, un petit projet hébergé sur Codeberg (pas sur GitHub, c’est voulu ✊) qui fournit un fichier AGENTS.md d’une trentaine de lignes, prêt à copier dans votre repo. Sauf que au lieu d’expliquer aux agents comment bosser sur votre projet, il leur interdit TOUT ! Lecture de fichiers, review de code, analyse statique, accès aux issues et aux pull requests, entraînement sur le code source… la totale.

Chrome DevTools MCP – Quand Google file les clés de Chrome à l’IA

Si vous utilisez un agent IA pour coder, y’a un truc qui sorti y’a quelques semaines et qui change clairement la donne. En fait c’est l’équipe de Chrome DevTools qui a balancé son propre serveur MCP pour connecter vos agents directement aux entrailles de Chrome. 29 outils répartis en 6 catégories (input, navigation, émulation, perf, réseau, debug)… et comme vous allez voir, c’est du lourd !

J’ai testé et c’est pas un wrapper qui clique bêtement sur des boutons.
Chrome DevTools MCP
donne en réalité un accès direct au Chrome DevTools Protocol via Puppeteer à votre IA. Du coup, votre agent peut capturer des traces de performance, lancer un audit Lighthouse, prendre des snapshots mémoire ou inspecter les requêtes réseau. En gros, TOUT ce que vous faites à la main dans l’onglet DevTools de Chrome, votre IA peut le faire à votre place.

Claude Code – Pilotez votre terminal depuis votre canapé

Claude Code tourne en local et c’est son gros avantage car ça permet par exemple d’agir sur votre machine, de lancer des scripts…etc. Mais c’est aussi sa grosse limite car à cause de ça, vous êtes cloué devant votre terminal. J’étais en quête depuis un moment d’une solution et je vous avais déjà parlé de
Vibe Companion
y’a pas longtemps mais tous ces outils vont disparaitre puisque Anthropic vient de sortir Remote Control, une feature qui transforme claude.ai ou l’app mobile en télécommande pour votre session locale. Comme ça, vos fichiers restent chez vous et seule l’interface voyage.

Waymo World Model – Quand l’IA invente ses propres routes

Entraîner une voiture autonome c’est un peu comme apprendre à nager… sauf que si vous vous plantez, c’est pas juste votre ego d’informaticien qui coule mais ce sont des choses graves qui peuvent arriver. Ça tombe bien puisque Waymo vient de dévoiler cette semaine un truc plutôt pas con pour aider à régler ce problème.

Ça s’appelle le World Model et c’est un modèle génératif capable de fabriquer des simulations ultra-réalistes de conduite. Comme ça, au lieu d’attendre qu’un éléphant traverse une route de Phoenix en Arizona pour savoir comment réagir (oui, c’est un de leurs exemples !), l’IA génère elle-même ces scénarios complètement dingues dans son propre monde virtuel.

Personal AI Infrastructure – L’agent intelligent qui vous connaît vraiment

On nous parle d’agents IA à toutes les sauces depuis deeeees mois mais au final, on se retrouve la plupart du temps avec des outils “stateless” qui perdent le fil dès qu’une session se termine. Heureusement, le projet
Personal AI Infrastructure
(ou PAI pour les intimes) de Daniel Miessler propose justement de régler ce problème en classant les systèmes IA en 3 niveaux.

Le niveau 1, c’est le chatbot de base type ChatGPT… vous posez une question, il répond, il oublie tout. Le niveau 2, c’est l’agent (genre
Claude Code
ou Cursor) qui peut exécuter des trucs mais qui ne vous connait pas vraiment. Et le niveau 3, c’est PAI, une infrastructure complète qui observe, planifie, exécute et surtout… apprend de vous.