Catégorie : Sciences
CorridorKey – Le détourage de fond vert par IA
Détourer un sujet filmé sur un fond vert, c’est le cauchemar classique du compositing. Entre les cheveux rebelles, le flou de mouvement et cette satanée frange verte sur les bords, on y passe vite des heures. Faut dire que la plupart des outils de détourage automatiques actuels c’est de la merde, puisqu’ils se contentent d’extraire des masques binaires un peu brutaux qui massacrent les détails fins.
Et c’est là qu’intervient
CorridorKey
, un outil dont le code est disponible sur GitHub et développé par Niko Pueringer de l’équipe
Corridor Crew
. Au lieu de bêtement découper la silhouette, ce réseau de neurones fait un travail de dé-mélange de couleurs (unmixing) hyper précis. Cela lui permet de reconstruire la couleur d’origine de chaque pixel en retirant le fond vert, tout en générant un canal alpha linéaire très propre… et c’est dingue parce que ça change tout en terme de qualité de rendu !
Sauvegardes disparues sur Forza Horizon 6 : Microsoft réagit et déploie plusieurs correctifs
MyDataRun : la FFA lance le « Strava » de vos chronos officiels (et c’est accessible à tous)
Raspberry Pi 5 16 Go à près de 300 € : à ce prix le mini PC devient plus malin
« Un véritable chaos » : Barcelone va bannir les vélos électriques en libre-service
Amazon casse le prix de la RTX 5060 Ti 8 Go et il y a même des cadeux offerts
Android 17 dévoile une option parfaite pour créer vos TikTok
Presque huit mois après son annonce, le Google Home Speaker donne enfin de ses nouvelles
DiffusionGemma : le nouveau modèle de Google écrit son texte d’un bloc, et 4 fois plus vite
Plus de 1 000 tokens par seconde sur une seule carte H100, l’accélérateur que Nvidia vend aux centres de données, et environ 700 sur une RTX 5090, sa carte gaming haut de gamme. C’est le débit que Google DeepMind annonce pour DiffusionGemma, son nouveau modèle d’IA ouvert, à peu près quatre fois ce que produisent les modèles Gemma classiques de taille comparable.
Toute la différence se joue dans la façon de générer le texte. Les modèles de langage habituels sont autorégressifs : ils écrivent de gauche à droite, un token à la fois, le token étant le petit morceau de mot que manipule une IA. DiffusionGemma fait tout autrement.
