Menu

Aucun menu défini dans le customizer.

Actus AutomatiséesActus Techintelligence-artificielle/ia-developpementlinux-open-source/logiciels-libresONNXOpenCVopencv5Sciences

OpenCV 5.0 sait maintenant faire tourner des IA façon ChatGPT directement dans son moteur

Actualités Automatisées

OpenCV 5.0 sait maintenant faire tourner des IA façon ChatGPT directement dans son moteur

🕒 Publié le : 09/06/2026 à 09:58
 |  ✍️ Auteur : Vincent Lautier
 |  📚 Source : Les news de Korben

OpenCV, vous l’utilisez sans doute déjà sans le savoir. Cette bibliothèque open source de vision par ordinateur, autrement dit une grosse boîte à outils qui apprend aux logiciels à analyser images et vidéos, se cache derrière la reconnaissance de visages de votre téléphone, les caméras d’usine ou les yeux des robots. Née chez Intel à la fin des années 90, elle vient de franchir un cap avec sa version 5.0, dévoilée autour de la conférence CVPR de Denver et rendue installable en un clic.

Le cœur du chantier, c’est son module DNN, le composant chargé d’exécuter les modèles d’intelligence artificielle, et qui a été réécrit de fond en comble.

L’ancien moteur traitait les calculs un par un, dans l’ordre. Le nouveau dessine d’abord le graphe entier des opérations avant de les lancer, ce qui lui permet de fusionner des étapes et de digérer beaucoup mieux les transformers, ces architectures mathématiques qui forment l’ossature de toute l’IA générative d’aujourd’hui.

Un chiffre résume le bond accompli. La compatibilité avec ONNX, le format qui sert à faire voyager un modèle d’un logiciel à l’autre, grimpe d’à peine plus de 20% sur les versions 4.x à plus de 80% sur cette mouture. Autant dire un autre monde.

Mais le vrai morceau de bravoure est ailleurs. OpenCV 5 est capable d’exécuter lui-même des grands modèles de langage, ces LLM qui font tourner ChatGPT, et même des modèles auxquels vous montrez une image et qui la décrivent en mots, sans aucun moteur tiers branché à côté.

Et on ne parle pas de modèles au rabais, puisque la liste inclut le Qwen 2.5 d’Alibaba et les Gemma de Google. Plus fort encore, lors des essais maison, la réponse de Qwen collait mot pour mot à celle d’ONNX Runtime, l’outil de référence de Microsoft pour ce genre de tâches. Pour une bibliothèque qui n’avait pas du tout été pensée pour ça, le résultat force le respect.

Le reste relève de la grosse mise à niveau. La 5.0 sait tirer parti d’à peu près toutes les puces du marché, des Intel aux Arm en passant par les Snapdragon de Qualcomm et la jeune architecture libre RISC-V, son volet de vision en trois dimensions a été réorganisé en briques plus claires, et son code réclame désormais un compilateur plus récent qu’à l’époque de la version 4.0, sortie en 2018.

Détail qui a son importance, tout ce travail reste mené par une fondation à but non lucratif,
OpenCV.org
, épaulée par le studio Big Vision et par des équipes basées en Chine. Pas par un géant privé.

Franchement, voir une vieille bibliothèque de vision proche des vingt-cinq ans se mettre à faire tourner des modèles de langage, c’est quand même pas mal.

Source :
Phoronix

Avatar de Krigs

À propos de l'auteur

https://github.com/Krigsexe

Voir tous les articles de Krigs

Leave a Comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Profil Gravatar