Link to this sectionYOLOv9 vs YOLO26#
Le paysage de la détection d'objets en temps réel a considérablement évolué au cours des dernières années. Alors que les praticiens du machine learning cherchent à déployer des modèles sur une variété de matériels, choisir la bonne architecture est crucial. Dans ce guide technique complet, nous comparons deux jalons majeurs dans le domaine de la vision par ordinateur : YOLOv9, introduit début 2024 avec une attention particulière sur l'optimisation des chemins de gradient, et Ultralytics YOLO26, le tout dernier framework à la pointe de la technologie, sorti début 2026, qui redéfinit totalement l'inférence en périphérie et la stabilité de l'entraînement.
Link to this sectionRésumé exécutif : Lignée des modèles et paternité#
Comprendre les origines de ces modèles de deep learning apporte un contexte précieux concernant leurs choix de conception architecturale et leurs publics cibles.
Link to this sectionYOLOv9#
Créé par Chien-Yao Wang et Hong-Yuan Mark Liao de l'Institut des sciences de l'information de l'Academia Sinica à Taïwan, YOLOv9 est sorti le 21 février 2024. Le modèle se concentre fortement sur des concepts théoriques de deep learning, abordant spécifiquement le problème du goulot d'étranglement de l'information dans les réseaux de neurones convolutifs (CNN) profonds.
Link to this sectionUltralytics YOLO26#
Créé par Glenn Jocher et Jing Qiu chez Ultralytics, YOLO26 est sorti le 14 janvier 2026. S'appuyant sur le succès massif de ses prédécesseurs comme YOLO11 et YOLOv8, YOLO26 a été conçu dès le départ pour privilégier la préparation à la production, le déploiement en périphérie et une efficacité native de bout en bout.
Prêt à mettre à niveau ton pipeline de vision par ordinateur ? Tu peux facilement entraîner et déployer des modèles YOLO26 dans le cloud sans écrire de code en utilisant la plateforme Ultralytics.
Link to this sectionInnovations architecturales#
Les deux modèles introduisent des changements révolutionnaires dans la façon dont les réseaux de neurones traitent les données visuelles, mais ils abordent le problème sous des angles différents.
Link to this sectionProgrammable Gradient Information dans YOLOv9#
La contribution principale de YOLOv9 au domaine est l'introduction de Programmable Gradient Information (PGI) et du Generalized Efficient Layer Aggregation Network (GELAN). À mesure que les réseaux de neurones deviennent plus profonds, ils souffrent souvent d'une perte d'information lors du processus de propagation vers l'avant. PGI garantit que les gradients utilisés pour mettre à jour les poids pendant la rétropropagation restent précis et fiables, permettant à l'architecture GELAN d'atteindre une haute précision avec moins de paramètres.
Cependant, YOLOv9 repose fortement sur la technique traditionnelle de Non-Maximum Suppression (NMS) pour le post-traitement, ce qui peut devenir un goulot d'étranglement en termes de latence lors de l'inférence en conditions réelles.
Link to this sectionL'architecture Edge-First de YOLO26#
YOLO26 adopte une approche radicalement différente en optimisant l'ensemble du pipeline, de l'entraînement au déploiement en temps réel. Il s'appuie sur la conception sans NMS de bout en bout introduite pour la première fois dans YOLOv10, éliminant entièrement le besoin de post-traitement NMS. Cela se traduit par une latence incroyablement faible, ce qui le rend fortement optimisé pour les appareils en périphérie comme le Raspberry Pi ou NVIDIA Jetson.
De plus, YOLO26 supprime complètement la Distribution Focal Loss (DFL). Ce changement structurel simplifie l'exportation du modèle vers ONNX et offre une bien meilleure compatibilité avec les microcontrôleurs basse consommation.
Pour la phase d'entraînement, YOLO26 intègre le nouvel optimiseur MuSGD, un hybride de Stochastic Gradient Descent et de Muon (inspiré par les méthodologies d'entraînement LLM de Kimi K2 de Moonshot AI). Cela comble le fossé entre les innovations en matière d'entraînement de grands modèles de langage (LLM) et la vision par ordinateur, offrant un entraînement nettement plus stable et des temps de convergence plus rapides.
Link to this sectionComparaison des performances et des mesures#
Lors de l'évaluation sur le jeu de données COCO largement utilisé, les deux modèles démontrent des capacités exceptionnelles, mais l'écosystème Ultralytics brille par ses vitesses d'inférence pratiques et son efficacité en termes de paramètres.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20,0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40,9 | 38.9 | 1.7 | 2,4 | 5.4 |
| YOLO26s | 640 | 48,6 | 87.2 | 2.5 | 9,5 | 20,7 |
| YOLO26m | 640 | 53,1 | 220.0 | 4.7 | 20,4 | 68,2 |
| YOLO26l | 640 | 55,0 | 286.2 | 6.2 | 24,8 | 86,4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55,7 | 193,9 |
Link to this sectionAnalyse des résultats#
- Vitesse et efficacité : Comme YOLO26 utilise une architecture sans NMS et des fonctions de perte simplifiées, il bénéficie d'une inférence CPU jusqu'à 43 % plus rapide par rapport aux architectures héritées. Le modèle YOLO26n tourne à une vitesse fulgurante de 1,7 ms sur un GPU NVIDIA T4 utilisant TensorRT, ce qui en fait le choix ultime pour les flux vidéo en temps réel.
- Précision : Le modèle YOLO26x atteint un mAP de 57,5 inégalé, surpassant le plus grand modèle YOLOv9e tout en maintenant une latence plus faible.
- Exigences en mémoire : Les modèles Ultralytics sont reconnus pour leur efficacité. YOLO26 nécessite beaucoup moins de mémoire CUDA pendant l'entraînement du modèle et l'inférence par rapport aux modèles de vision basés sur des Transformers complexes, permettant aux développeurs d'utiliser des tailles de lot plus grandes sur du matériel grand public.
Link to this sectionÉcosystème, facilité d'utilisation et polyvalence#
La véritable force de l'écosystème Ultralytics réside dans son expérience utilisateur. Alors que les chercheurs utilisant la base de code GitHub de YOLOv9 doivent naviguer dans des configurations d'environnement complexes et des scripts manuels, YOLO26 est entièrement intégré à l'API Python intuitive d'Ultralytics.
Link to this sectionExemple d'API rationalisée#
L'entraînement d'un modèle YOLO26 de pointe ne nécessite que quelques lignes de code Python :
from ultralytics import YOLO
# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export natively to ONNX format in a single command
model.export(format="onnx")Link to this sectionPolyvalence des tâches inégalée#
Contrairement à YOLOv9, qui est principalement conçu pour la détection d'objets standard, YOLO26 prend nativement en charge un vaste éventail de tâches de vision par ordinateur dès la sortie de boîte. L'architecture comprend des améliorations spécifiques pour diverses applications :
- Segmentation d'instance : Comprend une perte de segmentation sémantique spécialisée et un proto multi-échelle pour des masques parfaits au niveau du pixel.
- Estimation de pose : Intègre l'estimation de vraisemblance logarithmique résiduelle (RLE) pour suivre les points clés du squelette avec une précision extrême.
- Boîtes englobantes orientées (OBB) : Inclut une fonction de perte d'angle spécialisée, conçue spécifiquement pour résoudre les problèmes de limites dans la détection d'objets pivotés pour l'imagerie aérienne.
- Classification d'images : Catégorisation robuste pour des images entières basée sur les normes ImageNet.
Tous les modèles YOLO26 bénéficient d'une intégration transparente avec la plateforme Ultralytics, offrant l'étiquetage de jeux de données intégré, l'apprentissage actif et des pipelines de déploiement instantané.
Link to this sectionApplications concrètes#
Choisir entre ces modèles dépend souvent de l'environnement dans lequel ils seront déployés.
Link to this sectionIoT et robotique en périphérie#
Pour la robotique, les drones autonomes et les appareils IoT de maison intelligente, YOLO26 est le champion incontesté. L'intégration de ProgLoss + STAL apporte des améliorations notables à la reconnaissance des petits objets, ce qui est critique pour le suivi agricole à partir de drones à haute altitude. Combiné à une inférence CPU 43 % plus rapide et à une conception sans NMS, YOLO26 peut fonctionner de manière fluide sur du matériel sans GPU dédié.
Link to this sectionRecherche universitaire et analyse de gradient#
YOLOv9 reste un modèle très respecté dans les cercles universitaires. Les chercheurs étudiant les limites théoriques du flux de gradient, ou ceux cherchant à construire des couches PyTorch personnalisées basées sur le concept PGI, trouveront que la base de code de YOLOv9 est une excellente fondation pour l'exploration de la théorie du deep learning.
Link to this sectionPipelines de fabrication à grande vitesse#
Dans les environnements industriels comme la détection de défauts automatisée sur des tapis roulants à haute vitesse, les vitesses fulgurantes de TensorRT des modèles YOLO26 garantissent qu'aucune image n'est perdue, maximisant le rendement des systèmes d'assurance qualité.
Link to this sectionCas d'utilisation et recommandations#
Choisir entre YOLOv9 et YOLO26 dépend de tes exigences de projet spécifiques, des contraintes de déploiement et de tes préférences en matière d'écosystème.
Link to this sectionQuand choisir YOLOv9#
YOLOv9 est un choix solide pour :
- Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
- Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
- Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.
Link to this sectionQuand choisir YOLO26#
YOLO26 est recommandé pour :
- Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
- Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
- Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.
Link to this sectionConclusion#
Les deux modèles représentent d'incroyables avancées pour la communauté open source. YOLOv9 a introduit des améliorations théoriques vitales au flux de gradient qui inspireront des architectures pour les années à venir. Cependant, pour les développeurs modernes, les startups et les équipes d'entreprise cherchant un équilibre parfait entre vitesse, précision et facilité de déploiement, Ultralytics YOLO26 est la recommandation évidente.
En éliminant le NMS, en introduisant le puissant optimiseur MuSGD et en fournissant une suite d'outils inégalée pour les tâches de détection, de segmentation et de pose, YOLO26 garantit que tes projets de vision par ordinateur sont construits sur le framework le plus fiable et le plus pérenne disponible aujourd'hui.