YOLOv9 YOLO26 : évolution de la détection d'objets en temps réel

Dans le domaine en pleine évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de modèle pour trouver le juste équilibre entre performances, efficacité et facilité de déploiement. Cette comparaison explore les différences techniques entre YOLOv9, un modèle puissant introduit début 2024, et YOLO26, la dernière version de pointe Ultralytics en janvier 2026. Si ces deux modèles représentent des étapes importantes dans la YOLO , ils répondent à des besoins différents en termes de vitesse, de stabilité de formation et de complexité de déploiement.

Présentation du modèle et auteurs

Comprendre l'histoire de ces architectures permet de mieux comprendre leur philosophie de conception.

YOLOv9 : Informations de gradient programmables

Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation :Institut des sciences de l'information, Academia Sinica
Date : 21 février 2024
Liens :Article Arxiv | Référentiel GitHub

YOLOv9 le concept d'informations de gradient programmables (PGI) et le réseau généralisé d'agrégation de couches efficaces (GELAN). Ces innovations ont permis de résoudre le problème du « goulot d'étranglement informationnel » dans les réseaux neuronaux profonds, où les données sont perdues lorsqu'elles passent par des couches successives. Le PGI garantit la préservation des informations critiques tout au long du réseau profond, ce qui permet des détections très précises, en particulier dans les scènes complexes.

YOLO26 : le spécialiste de bout en bout de la périphérie

Auteurs : Glenn Jocher, Jing Qiu
Organisation :Ultralytics
Date : 14/01/2026Liens
:Documentation officielle | Référentiel GitHub

S'appuyant sur l'héritage de YOLOv8 et YOLO11, YOLO26 représente une évolution vers un déploiement simplifié et ultra-rapide. Il est nativement NMS de bout en bout, éliminant ainsi le besoin d'un post-traitement de suppression non maximale. Ce choix de conception, combiné à la suppression de la perte focale de distribution (DFL), rend YOLO26 exceptionnellement rapide sur CPU les appareils périphériques. Il est également le premier à utiliser l'optimiseur MuSGD, un hybride de SGD Muon (inspiré de la formation LLM), afin d'assurer une convergence stable.

En savoir plus sur YOLO26

Comparaison des performances et des indicateurs

Le tableau suivant compare les performances des modèles standard sur l'ensemble de données COCO . Notez l'avantage significatif de YOLO26 en termes de vitesse sur CPU , grâce à l'optimisation de son architecture.

Modèle	Taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	paramètres ^(M)	FLOPs ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Analyse des performances

YOLO26 présente un avantage évident en termes de latence et d'efficacité de calcul. Par exemple, YOLO26n atteint un mAP 40,9 %) supérieur à celui de YOLOv9t (38,3 %) tout en utilisant nettement moins de FLOP (5,4 milliards contre 7,7 milliards). Cette efficacité est cruciale pour les applications fonctionnant sur des appareils périphériques alimentés par batterie.

Plongée architecturale en profondeur

Architecture YOLOv9

YOLOv9 sur la conservation du flux d'informations. Son backbone GELAN combine les points forts de CSPNet (planification du chemin du gradient) et d'ELAN (vitesse d'inférence) pour créer un extracteur de caractéristiques léger mais puissant. La branche auxiliaire PGI fournit des informations fiables sur le gradient pendant l'entraînement aux couches plus profondes, qui sont ensuite supprimées pendant l'inférence afin de conserver la légèreté du modèle.

Avantages : précision exceptionnelle sur les benchmarks difficiles ; excellente conservation des informations pour les scènes complexes.
Inconvénients : nécessite NMS ; architecture pouvant être complexe à modifier pour des tâches non standard ; charge de calcul plus importante pour un débit équivalent par rapport aux générations plus récentes.

Architecture de YOLO26

YOLO26 privilégie la vitesse d'inférence et la simplicité de déploiement.

ConceptionNMS: en entraînant le modèle à prédire des correspondances uniques de manière native, YOLO26 supprime NMS heuristique NMS . Cela réduit la variabilité de la latence et simplifie TensorRT , car NMS efficaces ne sont plus une dépendance.
Optimiseur MuSGD : inspiré du Kimi K2 de Moonshot AI, cet optimiseur combine la dynamique du SGD les propriétés adaptatives de l'optimiseur Muon. Cela apporte la stabilité de l'entraînement des modèles linguistiques à grande échelle (LLM) à la vision par ordinateur.
ProgLoss + STAL : L'introduction de la perte progressive (Progressive Loss) et de la perte d'attribution de cible souple (Soft-Target Assignment Loss, STAL) améliore considérablement la détection des petits objets, une faiblesse courante des détecteurs sans ancrage.

Formation et écosystème

L'expérience des développeurs diffère considérablement entre les deux modèles, en grande partie en raison des écosystèmes logiciels dans lesquels ils évoluent.

Facilité d'utilisation avec Ultralytics

Alors que YOLOv9 été intégré au Ultralytics , YOLO26 en fait partie intégrante. Cela garantit une prise en charge immédiate de toutes les fonctionnalités, notamment :

API unifiée : Passer d'une tâche à l'autre comme Estimation de pose ou Boîtes englobantes orientées (OBB) en modifiant simplement le fichier de poids du modèle (par exemple, yolo26n-pose.pt).
Ultralytics : téléchargez facilement des ensembles de données, ajoutez des annotations à l'aide d'assistants IA et formez-vous dans le cloud grâce à la Ultralytics .
Flexibilité d'exportation : prise en charge native de l'exportation en un clic vers des formats tels que CoreML pour iOS, TFLite Android et OpenVINO Intel .

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")

Mémoire et efficacité des ressources

YOLO26 nécessite généralement moins GPU pendant l'entraînement que l'architecture à double branche (PGI) YOLOv9. Cela permet aux chercheurs d'utiliser des lots plus volumineux sur du matériel grand public tel que les cartes NVIDIA 3060 ou 4090, ce qui accélère le cycle d'expérimentation.

Cas d'utilisation concrets

Quand choisir YOLOv9

YOLOv9 un concurrent sérieux dans les scénarios où la précision maximale sur des benchmarks statiques est la seule priorité et où les ressources informatiques sont abondantes.

Recherche universitaire : étude de la théorie des goulots d'étranglement de l'information et du flux de gradient dans les CNN.
Traitement côté serveur : GPU haute puissance analysant des séquences vidéo archivées où la latence en temps réel est moins critique.

Quand choisir YOLO26

YOLO26 est le choix recommandé pour les environnements de production et l'informatique de pointe.

Systèmes embarqués : son CPU jusqu'à 43 % plus rapide le rend idéal pour les déploiements Raspberry Pi ou NVIDIA dans le domaine de la robotique.
Analyse en temps réel : la conception NMS garantit une latence déterministe, essentielle pour les systèmes de conduite autonome et de sécurité.
Applications multimodales : grâce à la prise en charge native de la segmentation d'instances et de la pose, il sert de base polyvalente pour des pipelines complexes tels que l'analyse du comportement humain dans le commerce de détail ou le sport.

Conclusion

Alors que YOLOv9 des concepts théoriques révolutionnaires avec PGI, YOLO26 affine ces enseignements pour en faire un ensemble pragmatique et hautement performant. Son architecture de bout en bout, la suppression des goulots d'étranglement liés au post-traitement et son intégration à Ultralytics robuste Ultralytics en font le choix idéal pour les développeurs qui créent la prochaine génération d'applications d'IA.

Explorer d'autres modèles

Si vous souhaitez explorer d'autres options, pensez à consulter YOLO11, le prédécesseur de YOLO26, ou YOLOv10, qui a été le pionnier de l'approche NMS.