YOLOv9 YOLO26 : évolution de la détection d'objets en temps réel
Dans le domaine en pleine évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de modèle pour trouver le juste équilibre entre performances, efficacité et facilité de déploiement. Cette comparaison explore les différences techniques entre YOLOv9, un modèle puissant introduit début 2024, et YOLO26, la dernière version de pointe Ultralytics en janvier 2026. Si ces deux modèles représentent des étapes importantes dans la YOLO , ils répondent à des besoins différents en termes de vitesse, de stabilité de formation et de complexité de déploiement.
Présentation du modèle et auteurs
Comprendre l'histoire de ces architectures permet de mieux comprendre leur philosophie de conception.
YOLOv9 : Informations de gradient programmables
Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation :Institut des sciences de l'information, Academia Sinica
Date : 21 février 2024
Liens :Article Arxiv | Référentiel GitHub
YOLOv9 le concept d'informations de gradient programmables (PGI) et le réseau généralisé d'agrégation de couches efficaces (GELAN). Ces innovations ont permis de résoudre le problème du « goulot d'étranglement informationnel » dans les réseaux neuronaux profonds, où les données sont perdues lorsqu'elles passent par des couches successives. Le PGI garantit la préservation des informations critiques tout au long du réseau profond, ce qui permet des détections très précises, en particulier dans les scènes complexes.
YOLO26 : le spécialiste de bout en bout de la périphérie
Auteurs : Glenn Jocher, Jing Qiu
Organisation :Ultralytics
Date : 14/01/2026Liens
:Documentation officielle | Référentiel GitHub
S'appuyant sur l'héritage de YOLOv8 et YOLO11, YOLO26 représente une évolution vers un déploiement simplifié et ultra-rapide. Il est nativement NMS de bout en bout, éliminant ainsi le besoin d'un post-traitement de suppression non maximale. Ce choix de conception, combiné à la suppression de la perte focale de distribution (DFL), rend YOLO26 exceptionnellement rapide sur CPU les appareils périphériques. Il est également le premier à utiliser l'optimiseur MuSGD, un hybride de SGD Muon (inspiré de la formation LLM), afin d'assurer une convergence stable.
Comparaison des performances et des indicateurs
Le tableau suivant compare les performances des modèles standard sur l'ensemble de données COCO . Notez l'avantage significatif de YOLO26 en termes de vitesse sur CPU , grâce à l'optimisation de son architecture.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Analyse des performances
YOLO26 présente un avantage évident en termes de latence et d'efficacité de calcul. Par exemple, YOLO26n atteint un mAP 40,9 %) supérieur à celui de YOLOv9t (38,3 %) tout en utilisant nettement moins de FLOP (5,4 milliards contre 7,7 milliards). Cette efficacité est cruciale pour les applications fonctionnant sur des appareils périphériques alimentés par batterie.
Plongée architecturale en profondeur
Architecture YOLOv9
YOLOv9 sur la conservation du flux d'informations. Son backbone GELAN combine les points forts de CSPNet (planification du chemin du gradient) et d'ELAN (vitesse d'inférence) pour créer un extracteur de caractéristiques léger mais puissant. La branche auxiliaire PGI fournit des informations fiables sur le gradient pendant l'entraînement aux couches plus profondes, qui sont ensuite supprimées pendant l'inférence afin de conserver la légèreté du modèle.
- Avantages : précision exceptionnelle sur les benchmarks difficiles ; excellente conservation des informations pour les scènes complexes.
- Inconvénients : nécessite NMS ; architecture pouvant être complexe à modifier pour des tâches non standard ; charge de calcul plus importante pour un débit équivalent par rapport aux générations plus récentes.
Architecture de YOLO26
YOLO26 privilégie la vitesse d'inférence et la simplicité de déploiement.
- ConceptionNMS: en entraînant le modèle à prédire des correspondances uniques de manière native, YOLO26 supprime NMS heuristique NMS . Cela réduit la variabilité de la latence et simplifie TensorRT , car NMS efficaces ne sont plus une dépendance.
- Optimiseur MuSGD : inspiré du Kimi K2 de Moonshot AI, cet optimiseur combine la dynamique du SGD les propriétés adaptatives de l'optimiseur Muon. Cela apporte la stabilité de l'entraînement des modèles linguistiques à grande échelle (LLM) à la vision par ordinateur.
- ProgLoss + STAL : L'introduction de la perte progressive (Progressive Loss) et de la perte d'attribution de cible souple (Soft-Target Assignment Loss, STAL) améliore considérablement la détection des petits objets, une faiblesse courante des détecteurs sans ancrage.
Formation et écosystème
L'expérience des développeurs diffère considérablement entre les deux modèles, en grande partie en raison des écosystèmes logiciels dans lesquels ils évoluent.
Facilité d'utilisation avec Ultralytics
Alors que YOLOv9 été intégré au Ultralytics , YOLO26 en fait partie intégrante. Cela garantit une prise en charge immédiate de toutes les fonctionnalités, notamment :
- API unifiée : Passer d'une tâche à l'autre comme Estimation de pose ou Boîtes englobantes orientées (OBB) en modifiant simplement le fichier de poids du modèle (par exemple,
yolo26n-pose.pt). - Ultralytics : téléchargez facilement des ensembles de données, ajoutez des annotations à l'aide d'assistants IA et formez-vous dans le cloud grâce à la Ultralytics .
- Flexibilité d'exportation : prise en charge native de l'exportation en un clic vers des formats tels que CoreML pour iOS, TFLite Android et OpenVINO Intel .
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")
Mémoire et efficacité des ressources
YOLO26 nécessite généralement moins GPU pendant l'entraînement que l'architecture à double branche (PGI) YOLOv9. Cela permet aux chercheurs d'utiliser des lots plus volumineux sur du matériel grand public tel que les cartes NVIDIA 3060 ou 4090, ce qui accélère le cycle d'expérimentation.
Cas d'utilisation concrets
Quand choisir YOLOv9
YOLOv9 un concurrent sérieux dans les scénarios où la précision maximale sur des benchmarks statiques est la seule priorité et où les ressources informatiques sont abondantes.
- Recherche universitaire : étude de la théorie des goulots d'étranglement de l'information et du flux de gradient dans les CNN.
- Traitement côté serveur : GPU haute puissance analysant des séquences vidéo archivées où la latence en temps réel est moins critique.
Quand choisir YOLO26
YOLO26 est le choix recommandé pour les environnements de production et l'informatique de pointe.
- Systèmes embarqués : son CPU jusqu'à 43 % plus rapide le rend idéal pour les déploiements Raspberry Pi ou NVIDIA dans le domaine de la robotique.
- Analyse en temps réel : la conception NMS garantit une latence déterministe, essentielle pour les systèmes de conduite autonome et de sécurité.
- Applications multimodales : grâce à la prise en charge native de la segmentation d'instances et de la pose, il sert de base polyvalente pour des pipelines complexes tels que l'analyse du comportement humain dans le commerce de détail ou le sport.
Conclusion
Alors que YOLOv9 des concepts théoriques révolutionnaires avec PGI, YOLO26 affine ces enseignements pour en faire un ensemble pragmatique et hautement performant. Son architecture de bout en bout, la suppression des goulots d'étranglement liés au post-traitement et son intégration à Ultralytics robuste Ultralytics en font le choix idéal pour les développeurs qui créent la prochaine génération d'applications d'IA.
Explorer d'autres modèles
Si vous souhaitez explorer d'autres options, pensez à consulter YOLO11, le prédécesseur de YOLO26, ou YOLOv10, qui a été le pionnier de l'approche NMS.