Nemotron 3 – Nvidia débarque dans l’open source et crache du token comme jamais
Vous voulez faire tourner un modèle d’IA en local sans avoir besoin d’un serveur de la NASA ? Eh bien Nvidia vient de lâcher une bombe avec Nemotron 3, une famille de modèles open source plutôt impressionnant et surtout, ils ont publié leurs données d’entraînement afin de jouer la transparence totale. Chapeau !
Le modèle phare de cette nouvelle famille s’appelle Nemotron 3 Nano et c’est un modèle de 30 milliards de paramètres, mais attention, il n’en active que 3,5 milliards à la fois grâce à une architecture hybride qui mélange du
Mamba-2
et du Mixture-of-Experts (
MoE
). Ça permet de garder des performances de ouf tout en restant léger niveau ressources.
