YOLO26 vs YOLOv9: la prochaine évolution dans la détection d'objets en temps réel
L'évolution des architectures de détection d'objets a été marquée par une recherche constante de vitesse, de précision et d'efficacité. Comparaison entre YOLO26 et YOLOv9 met en évidence cette progression rapide. Alors que YOLOv9 les limites de la rétention d'informations grâce à des gradients programmables, le nouveau YOLO26 redéfinit le paysage avec une architecture de bout en bout, NMS, spécialement optimisée pour les performances de pointe et CPU massives CPU .
Aperçu du modèle
YOLO26
YOLO26 représente la technologie de pointe en matière d'IA visuelle au début de l'année 2026. Développé par Ultralytics, il introduit une conception native de bout en bout qui élimine le besoin de suppression non maximale (NMS), rationalisant ainsi les pipelines de déploiement. En supprimant la perte focale de distribution (DFL) et en intégrant le nouvel optimiseur MuSGD, un hybride de SGD Muon inspiré de la formation LLM, YOLO26 atteint CPU jusqu'à 43 % plus rapide tout en conservant une précision de premier ordre.
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation :Ultralytics
- Date : 14 janvier 2026
- Caractéristique principale : détection de bout en bout NMS, optimiseur MuSGD, ProgLoss + STAL
- GitHub :Dépôt Ultralytics
YOLOv9
Sorti début 2024, YOLOv9 a introduit le concept d'informations de gradient programmables (PGI) et l'architecture GELAN. Ces innovations ont permis de résoudre le problème du « goulot d'étranglement informationnel » dans les réseaux profonds, en garantissant que les données critiques ne soient pas perdues pendant le processus de propagation avant. Il reste un modèle puissant, en particulier pour les applications de recherche nécessitant une grande efficacité des paramètres.
- Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
- Organisation : Institute of Information Science, Academia Sinica
- Date : 21 février 2024
- Caractéristique principale : informations programmables sur les gradients (PGI), architecture GELAN
- Arxiv :YOLOv9
- GitHub :Dépôt YOLOv9
Comparaison des architectures techniques
La divergence architecturale entre ces deux modèles marque un passage de l'optimisation théorique des flux d'informations à l'efficacité pratique du déploiement.
YOLO26 : efficacité et conception axée sur la périphérie
YOLO26 vise à réduire la charge informatique liée au post-traitement et au calcul des pertes.
- NMS de bout en bout : contrairement aux détecteurs traditionnels qui génèrent des boîtes englobantes redondantes nécessitant NMS, YOLO26 prédit directement l'ensemble exact d'objets. Cela réduit la variance de latence et simplifie l'exportation vers des formats tels que ONNX TensorRT, car NMS personnalisés complexes ne sont plus nécessaires.
- ProgLoss + STAL : L'introduction de Progressive Loss et Soft-Target Anchor Labeling améliore considérablement la détection des petits objets, une exigence essentielle pour l'imagerie par drone et l'inspection robotique.
- Optimiseur MuSGD : apportant les innovations issues de l'entraînement des grands modèles linguistiques à la vision par ordinateur, cet optimiseur hybride stabilise la dynamique d'entraînement, permettant une convergence plus rapide avec moins de réglages d'hyperparamètres.
YOLOv9: Conservation des informations
L'architecture YOLOv9 est conçue pour résoudre le problème de la perte d'informations dans les réseaux profonds.
- PGI (Programmable Gradient Information) : une branche de supervision auxiliaire génère des gradients fiables pour mettre à jour les poids du réseau, garantissant ainsi que les couches profondes conservent les informations sémantiques.
- GELAN (Generalized Efficient Layer Aggregation Network) : cette infrastructure optimise l'utilisation des paramètres, permettant YOLOv9 une grande précision avec moins de paramètres que certains de ses prédécesseurs, souvent au prix d'une complexité computationnelle (FLOP) plus élevée par rapport au YOLO26 simplifié.
Simplicité de déploiement
La suppression du NMS YOLO26 change la donne pour le déploiement en périphérie. Dans les modèles plus anciens comme YOLOv9, NMS s'exécute sur le CPU si le modèle fonctionne sur un GPU, ce qui crée un goulot d'étranglement. La sortie de YOLO26 est immédiatement prête à l'emploi, ce qui le rend nettement plus rapide sur Raspberry Pi et les appareils mobiles.
Mesures de performance
Le tableau suivant compare les modèles sur des benchmarks standard. Notez l'avantage significatif de YOLO26 en termes de vitesse sur CPU , résultat direct de ses optimisations architecturales.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Avantages de Ultralytics
Bien que YOLOv9 de solides bases théoriques, l'utilisation de YOLO26 dans Ultralytics présente des avantages distincts pour les développeurs et les entreprises.
Facilité d'utilisation inégalée
Python Ultralytics transforme des workflows d'entraînement complexes en quelques lignes de code. Cette expérience « zéro à héros » contraste avec la configuration centrée sur la recherche de nombreux autres référentiels.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Polyvalence dans toutes les tâches
Contrairement à YOLOv9, qui se concentre principalement sur la détection, le Ultralytics et YOLO26 prennent en charge de manière native un éventail plus large de tâches de vision par ordinateur. Cela vous permet d'utiliser une API unique et unifiée pour :
- Segmentation d'instance: masquage précis des objets au niveau des pixels.
- Estimation de la pose: détection des points clés pour l'analyse de l'activité humaine.
- OBB (Oriented Bounding Box): détection d'objets pivotés, tels que des navires, dans les images satellites.
- Classification: catégorisation de l'image entière.
Entraînement et efficacité de la mémoire
Ultralytics sont conçus pour être économes en ressources. YOLO26 nécessite généralement moins GPU (VRAM) pendant l'entraînement que les alternatives à forte intensité de transformateurs. Cette efficacité permet :
- Des lots plus importants sur le matériel grand public.
- Réduisez les coûts liés au cloud computing.
- Cycles d'expérimentation plus rapides grâce à des poids pré-entraînés facilement disponibles.
Applications concrètes
Le choix du modèle approprié dépend de vos contraintes de déploiement spécifiques.
Edge Computing et IoT
YOLO26 est le champion incontesté des appareils périphériques. Son CPU 43 % plus rapide le rend viable pour la surveillance en temps réel sur des appareils tels que le Raspberry Pi ou NVIDIA Nano sans nécessiter de quantification lourde. Par exemple, un système de stationnement intelligent fonctionnant sur du matériel local bénéficie énormément de la conception NMS, qui réduit les pics de latence.
Inspection en haute altitude
Pour la surveillance agricole ou l'inspection des infrastructures à l'aide de drones, YOLO26 se distingue grâce aux fonctions ProgLoss + STAL. Celles-ci sont spécialement conçues pour mieux traiter les petits objets et les rapports d'aspect difficiles que les générations précédentes, garantissant ainsi une meilleure détection des fissures dans les pipelines ou des parasites sur les cultures.
Recherche universitaire
YOLOv9 reste un candidat sérieux pour la recherche universitaire, en particulier pour les études axées sur le flux de gradient et la théorie de l'architecture des réseaux. Son concept PGI offre une piste fascinante pour explorer la manière dont les réseaux neuronaux conservent la profondeur des informations.
Conclusion
Ces deux architectures marquent des étapes importantes dans le domaine de la vision par ordinateur. YOLOv9 l'importance des informations de gradient dans les réseaux profonds. Cependant, YOLO26 traduit ces enseignements en une puissance prête à l'emploi. Avec sa conception de bout en bout NMS, CPU supérieure et son intégration transparente dans la Ultralytics , YOLO26 offre le meilleur équilibre entre vitesse, précision et facilité d'utilisation pour les applications d'IA modernes.
Pour les développeurs qui souhaitent rester à la pointe de la technologie, nous recommandons de migrer vers YOLO26 afin de tirer parti des dernières avancées en matière de stabilité de l'optimiseur et de performances de pointe.
Lectures complémentaires
Si vous êtes intéressé par d'autres modèles haute performance de la Ultralytics , consultez YOLO11 pour les tâches générales ou RT-DETR pour la détection en temps réel basée sur un transformateur.