Menu

Aucun menu défini dans le customizer.

TurboQuant – Un LLM de 104B sur un MacBook, merci Google

Vous faites tourner des LLMs en local comme le gros fifou de Hipster IA que vous êtes et, Ô drame, la VRAM de votre ordinateur explose dès que le contexte dépasse 8000 pauvres malheureux tokens ?

Le problème c’est le KV cache les amis ! Le KV cache c’est ce truc qui stocke les clés et valeurs d’attention et qui grossit linéairement avec la longueur du prompt. C’est pour gérer ce problème que Google a annoncé sous la forme d’un whitepaper uniquement un algo qui compresse tout ça de 3,8 à 6,4 fois… et youpi pour nous, y’a un dev qui l’a déjà implémenté dans
un fork de llama.cpp
.

Google Photos modifie en douce quelques une de ses fonctions « magiques »

Google remanie discrètement le mode d’accès aux fonctions d’édition « magiques » de son application Google Photos. Ces changements, pour l’instant réservés à la version Android de l’appli, mettent de côté l’approche gestuelle que l’on connaissait, pour des interactions plus « traditionnelles ».

Test du M8 Mini de GMKtec : pas loin d’être le plus riquiqui des mini-PC

Soucieuse de se démarquer de certains concurrents comme Beelink, Geekom ou NiPoGi, la marque GMKtec a toujours retenu un design distinctif pour ses mini-PC. Le M8 Mini ne déroge pas à la règle et impressionne par son format qui ne doit cependant pas le mettre en difficulté : le Ryzen 5 Pro 6650H d’AMD lui donne un potentiel intéressant. Sur le papier…