YOLO26 vs YOLOv9: la prochaine évolution dans la détection d'objets en temps réel

L'évolution des architectures de détection d'objets a été marquée par une recherche constante de vitesse, de précision et d'efficacité. Comparaison entre YOLO26 et YOLOv9 met en évidence cette progression rapide. Alors que YOLOv9 les limites de la rétention d'informations grâce à des gradients programmables, le nouveau YOLO26 redéfinit le paysage avec une architecture de bout en bout, NMS, spécialement optimisée pour les performances de pointe et CPU massives CPU .

Aperçu du modèle

YOLO26

YOLO26 représente la technologie de pointe en matière d'IA visuelle au début de l'année 2026. Développé par Ultralytics, il introduit une conception native de bout en bout qui élimine le besoin de suppression non maximale (NMS), rationalisant ainsi les pipelines de déploiement. En supprimant la perte focale de distribution (DFL) et en intégrant le nouvel optimiseur MuSGD, un hybride de SGD Muon inspiré de la formation LLM, YOLO26 atteint CPU jusqu'à 43 % plus rapide tout en conservant une précision de premier ordre.

Auteurs : Glenn Jocher, Jing Qiu
Organisation :Ultralytics
Date : 14 janvier 2026
Caractéristique principale : détection de bout en bout NMS, optimiseur MuSGD, ProgLoss + STAL
GitHub :Dépôt Ultralytics

En savoir plus sur YOLO26

YOLOv9

Sorti début 2024, YOLOv9 a introduit le concept d'informations de gradient programmables (PGI) et l'architecture GELAN. Ces innovations ont permis de résoudre le problème du « goulot d'étranglement informationnel » dans les réseaux profonds, en garantissant que les données critiques ne soient pas perdues pendant le processus de propagation avant. Il reste un modèle puissant, en particulier pour les applications de recherche nécessitant une grande efficacité des paramètres.

Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation : Institute of Information Science, Academia Sinica
Date : 21 février 2024
Caractéristique principale : informations programmables sur les gradients (PGI), architecture GELAN
Arxiv :YOLOv9
GitHub :Dépôt YOLOv9

En savoir plus sur YOLOv9

Comparaison des architectures techniques

La divergence architecturale entre ces deux modèles marque un passage de l'optimisation théorique des flux d'informations à l'efficacité pratique du déploiement.

YOLO26 : efficacité et conception axée sur la périphérie

YOLO26 vise à réduire la charge informatique liée au post-traitement et au calcul des pertes.

NMS de bout en bout : contrairement aux détecteurs traditionnels qui génèrent des boîtes englobantes redondantes nécessitant NMS, YOLO26 prédit directement l'ensemble exact d'objets. Cela réduit la variance de latence et simplifie l'exportation vers des formats tels que ONNX TensorRT, car NMS personnalisés complexes ne sont plus nécessaires.
ProgLoss + STAL : L'introduction de Progressive Loss et Soft-Target Anchor Labeling améliore considérablement la détection des petits objets, une exigence essentielle pour l'imagerie par drone et l'inspection robotique.
Optimiseur MuSGD : apportant les innovations issues de l'entraînement des grands modèles linguistiques à la vision par ordinateur, cet optimiseur hybride stabilise la dynamique d'entraînement, permettant une convergence plus rapide avec moins de réglages d'hyperparamètres.

YOLOv9: Conservation des informations

L'architecture YOLOv9 est conçue pour résoudre le problème de la perte d'informations dans les réseaux profonds.

PGI (Programmable Gradient Information) : une branche de supervision auxiliaire génère des gradients fiables pour mettre à jour les poids du réseau, garantissant ainsi que les couches profondes conservent les informations sémantiques.
GELAN (Generalized Efficient Layer Aggregation Network) : cette infrastructure optimise l'utilisation des paramètres, permettant YOLOv9 une grande précision avec moins de paramètres que certains de ses prédécesseurs, souvent au prix d'une complexité computationnelle (FLOP) plus élevée par rapport au YOLO26 simplifié.

Simplicité de déploiement

La suppression du NMS YOLO26 change la donne pour le déploiement en périphérie. Dans les modèles plus anciens comme YOLOv9, NMS s'exécute sur le CPU si le modèle fonctionne sur un GPU, ce qui crée un goulot d'étranglement. La sortie de YOLO26 est immédiatement prête à l'emploi, ce qui le rend nettement plus rapide sur Raspberry Pi et les appareils mobiles.

Mesures de performance

Le tableau suivant compare les modèles sur des benchmarks standard. Notez l'avantage significatif de YOLO26 en termes de vitesse sur CPU , résultat direct de ses optimisations architecturales.

Modèle	Taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	paramètres ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Avantages de Ultralytics

Bien que YOLOv9 de solides bases théoriques, l'utilisation de YOLO26 dans Ultralytics présente des avantages distincts pour les développeurs et les entreprises.

Facilité d'utilisation inégalée

Python Ultralytics transforme des workflows d'entraînement complexes en quelques lignes de code. Cette expérience « zéro à héros » contraste avec la configuration centrée sur la recherche de nombreux autres référentiels.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Polyvalence dans toutes les tâches

Contrairement à YOLOv9, qui se concentre principalement sur la détection, le Ultralytics et YOLO26 prennent en charge de manière native un éventail plus large de tâches de vision par ordinateur. Cela vous permet d'utiliser une API unique et unifiée pour :

Segmentation d'instance: masquage précis des objets au niveau des pixels.
Estimation de la pose: détection des points clés pour l'analyse de l'activité humaine.
OBB (Oriented Bounding Box): détection d'objets pivotés, tels que des navires, dans les images satellites.
Classification: catégorisation de l'image entière.

Entraînement et efficacité de la mémoire

Ultralytics sont conçus pour être économes en ressources. YOLO26 nécessite généralement moins GPU (VRAM) pendant l'entraînement que les alternatives à forte intensité de transformateurs. Cette efficacité permet :

Des lots plus importants sur le matériel grand public.
Réduisez les coûts liés au cloud computing.
Cycles d'expérimentation plus rapides grâce à des poids pré-entraînés facilement disponibles.

Applications concrètes

Le choix du modèle approprié dépend de vos contraintes de déploiement spécifiques.

Edge Computing et IoT

YOLO26 est le champion incontesté des appareils périphériques. Son CPU 43 % plus rapide le rend viable pour la surveillance en temps réel sur des appareils tels que le Raspberry Pi ou NVIDIA Nano sans nécessiter de quantification lourde. Par exemple, un système de stationnement intelligent fonctionnant sur du matériel local bénéficie énormément de la conception NMS, qui réduit les pics de latence.

Inspection en haute altitude

Pour la surveillance agricole ou l'inspection des infrastructures à l'aide de drones, YOLO26 se distingue grâce aux fonctions ProgLoss + STAL. Celles-ci sont spécialement conçues pour mieux traiter les petits objets et les rapports d'aspect difficiles que les générations précédentes, garantissant ainsi une meilleure détection des fissures dans les pipelines ou des parasites sur les cultures.

Recherche universitaire

YOLOv9 reste un candidat sérieux pour la recherche universitaire, en particulier pour les études axées sur le flux de gradient et la théorie de l'architecture des réseaux. Son concept PGI offre une piste fascinante pour explorer la manière dont les réseaux neuronaux conservent la profondeur des informations.

Conclusion

Ces deux architectures marquent des étapes importantes dans le domaine de la vision par ordinateur. YOLOv9 l'importance des informations de gradient dans les réseaux profonds. Cependant, YOLO26 traduit ces enseignements en une puissance prête à l'emploi. Avec sa conception de bout en bout NMS, CPU supérieure et son intégration transparente dans la Ultralytics , YOLO26 offre le meilleur équilibre entre vitesse, précision et facilité d'utilisation pour les applications d'IA modernes.

Pour les développeurs qui souhaitent rester à la pointe de la technologie, nous recommandons de migrer vers YOLO26 afin de tirer parti des dernières avancées en matière de stabilité de l'optimiseur et de performances de pointe.

Lectures complémentaires

Si vous êtes intéressé par d'autres modèles haute performance de la Ultralytics , consultez YOLO11 pour les tâches générales ou RT-DETR pour la détection en temps réel basée sur un transformateur.