Catégorie : Actus Automatisées
Auto Feed RSS
L’Union européenne interdit l’IA générative dans ses communications officielles
L’UE adopte une approche très différente de celle des États-Unis en matière d’utilisation officielle des outils d’IA générative. La décision ne fait pas l’unanimité.
Cette marque de smartphone cartonne en Afrique : la France fait « toujours partie de nos projets »
Sans confirmer qu’il va lancer des smartphones en France, le géant chinois Tecno nous fait comprendre qu’il y songe sérieusement.
240 Hz et 0,5 ms pour 99 € : cet écran PC Lenovo prouve qu’on peut jouer sans se ruiner
Lenovo propose un bon écran PC orienté gaming avec ce modèle 24-10 de 23,8 pouces qui peut afficher jusqu’à 240 images/seconde et 0,5 ms MPRT, pour seulement 99 euros chez E.Leclerc au lieu de 129,95 euros.
TurboQuant – Un LLM de 104B sur un MacBook, merci Google
Vous faites tourner des LLMs en local comme le gros fifou de Hipster IA que vous êtes et, Ô drame, la VRAM de votre ordinateur explose dès que le contexte dépasse 8000 pauvres malheureux tokens ?
Le problème c’est le KV cache les amis ! Le KV cache c’est ce truc qui stocke les clés et valeurs d’attention et qui grossit linéairement avec la longueur du prompt. C’est pour gérer ce problème que Google a annoncé sous la forme d’un whitepaper uniquement un algo qui compresse tout ça de 3,8 à 6,4 fois… et youpi pour nous, y’a un dev qui l’a déjà implémenté dans
un fork de llama.cpp
.
