Menu

Aucun menu défini dans le customizer.

Reflect v1.0 – Programmer un humanoïde en une phrase

Un humanoïde qui traverse un immeuble, appelle l’ascenseur, ouvre un colis avec un outil et range les courses dans un tiroir, tout seul, et sur une seule consigne qui lui est donnée en langage naturel, ce n’est pas de la sorcellerie ! Non, c’est la démo qu’a sortie
Flexion Robotics
, une startup suisse, qui lance Reflect v1.0, son nouveau « cerveau » IA pour robots.

Car Flexion ne fabrique pas de robots. Cette spin-off zurichoise, fondée en 2024 par d’anciens chercheurs Nvidia, vend du logiciel, une couche d’intelligence qui se pose sur un humanoïde existant et le pilote de bout en bout.

GLM 5.2 – Le premier modèle IA open source que je garde

Les amis, il faut que je vous parle de
GLM 5.2
. Je l’utilise en ce moment même à travers Z.ai, et c’est la première fois qu’un modèle open weights me donne satisfaction sur ce que je lui demande de faire. Et dieu sait que j’en ai testé de ces putains de modèles !

GLM 5.2, c’est le dernier-né de Z.ai, le lab chinois connu avant sous le nom de Zhipu AI. Il est sorti en ce mois-ci (en juin), et c’est un gros bébé avec ses 744 milliards de paramètres en
Mixture-of-Experts
(MoE), dont à peu près 40 milliards qui s’activent pour chaque token, ainsi qu’une fenêtre de contexte qui monte à 1 million de tokens via la déclinaison glm-5.2[1m]. Le tout publié, comme toujours, sous licence MIT, avec les poids téléchargeables sur HuggingFace.

Cursor Mobile – Vos agents de coding pilotés depuis iPhone

Cursor
, le célèbre IDE de vibe coding, vient de sortir une app iOS qui permet de piloter des agents IA codant à votre place, directement depuis un smartphone.

Je ne parle donc pas d’écrire du code sur un écran de six pouces, hein, mais bien de lancer une tâche, de la confier à un agent qui bosse tout seul dans le cloud, et de garder un œil dessus pendant que vous êtes dans le métro ou affalé dans le canapé.

Cursor Mobile – Vos agents de coding pilotés depuis iPhone

Cursor
, le célèbre IDE de vibe coding, vient de sortir une app iOS qui permet de piloter des agents IA codant à votre place, directement depuis un smartphone.

Je ne parle donc pas d’écrire du code sur un écran de six pouces, hein, mais bien de lancer une tâche, de la confier à un agent qui bosse tout seul dans le cloud, et de garder un œil dessus pendant que vous êtes dans le métro ou affalé dans le canapé.

Un dépôt GitHub trop propre suffit à pirater Claude Code

Les chercheurs Andre Hall et Miller Engelbrecht, du Zero Day Investigative Network de Mozilla (0DIN), viennent de montrer comment prendre le contrôle complet d’une machine avec un dépôt GitHub qui ne contient aucun code malveillant.

Vous clonez le repo, vous demandez à Claude Code de “faire tourner le projet“, et trente secondes plus tard un inconnu obtient un accès shell sur votre poste, avec vos clés API et tous vos secrets en cadeau Bonux !

Un dépôt GitHub trop propre suffit à pirater Claude Code

Les chercheurs Andre Hall et Miller Engelbrecht, du Zero Day Investigative Network de Mozilla (0DIN), viennent de montrer comment prendre le contrôle complet d’une machine avec un dépôt GitHub qui ne contient aucun code malveillant.

Vous clonez le repo, vous demandez à Claude Code de “faire tourner le projet“, et trente secondes plus tard un inconnu obtient un accès shell sur votre poste, avec vos clés API et tous vos secrets en cadeau Bonux !

Dream Server – Un serveur IA complet chez vous en une commande

Monter une vraie IA à la maison, c’est vite une galère. Vous achetez une super machine puis vous collez dessus toute votre liste au père Noël (Chat local, reco vocale, génération d’image, RAG et compagnie) et vous voilà à empiler des dockers à n’en plus finir. Hé bien Light Heart Labs en a eu marre de ces bricolages et nous a pondu Dream Server, un outil qui câble tout ce petit monde à votre place !

EQ-Bench – Le benchmark de l’intelligence émotionnelle des IA

Sam Paech s’est rendu compte qu’on testait toujours les IA sur le code, les maths, et à qui
battra un prochain record
, mais presque jamais sur leur capacité à comprendre les émotions humaines ou à pondre un texte qui ne sente pas le slop de bot à plein nez. Et c’est pour ça qu’il a monté
EQ-Bench
, un benchmark qui note l**’intelligence émotionnelle des grands modèles de langage**.

Pour alimenter son benchmark, il colle tout un tas de modèles dans des jeux de rôle un peu tordus (45 scénarios dans sa dernière version) et c’est un autre modèle (Claude, en l’occurrence) qui joue l’examinateur. Il note alors chaque réponse sur huit dimensions, telles que l’empathie, la finesse sociale ou la capacité à poser une limite quand il faut, puis nous sort un classement façon Elo (le classement des échecs). Tout est open source, documenté dans un
papier de recherche
et Paech finance ce bazar avec ses propres deniers.

Age of LLM – Un Age of Empires où aucun humain ne joue

Vous voulez savoir comment GPT-5.5, Claude ou Grok raisonnent quand on les met sous pression ? Hé bien filez-leur un jeu de stratégie et regardez-les se faire la guerre.

C’est tout le principe d’
Age of LLM
, monté par Rymentz, un lecteur du blog où deux IA s’affrontent au tour par tour, sans aucun humain aux commandes.

C’est un benchmark 1v1 dans lequel on balance deux modèles sur la même carte, on leur donne les règles et puis c’est tout, sans aucun autre conseil de stratégie. À eux alors de déduire seuls comment contrer les attaques, quand bâtir leur économie, quand lever une armée pour aller défoncer la base d’en face, quand négocier la paix et quand carrément appuyer sur le gros bouton rouge. Parce que dans ce benchmark, on peut gagner de trois façons : la conquête militaire, la victoire diplomatique, ou la bombe nucléaire.

CrankGPT : l’IA à manivelle qui se mérite à la force des bras

CrankGPT vous connaissez ? Elle fait tourner un assistant vocal complet, reconnaissance de la voix comprise, sans prise murale, sans batterie et sans serveur distant, et pour l’alimenter vous tournez une manivelle dont la résistance grimpe quand le modèle réfléchit.

Derrière, deux anciens de Google. Katrin Tomanek, informaticienne, et Alex Kauffmann, passé par le laboratoire ATAP, la division des projets un peu fous. Ils ont monté Squeez Labs ensemble.

Leur conviction tient en une phrase : des modèles d’IA minuscules, privés et spécialisés suffisent pour une bonne partie de nos usages, sans datacenter ni abonnement, à condition d’accepter du matériel modeste.