Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLO26 : L'évolution de la détection d'objets, de l'approche sans ancres (anchor-free) à l'approche de bout en bout (end-to-end)#

Le domaine de la vision par ordinateur a connu des transformations incroyables au cours de la dernière décennie. Deux étapes marquantes de ce parcours sont la sortie de YOLOX, qui a popularisé les architectures sans ancres, et l'introduction récente d'Ultralytics YOLO26, qui redéfinit complètement les performances en temps réel grâce à une conception native de bout en bout, sans NMS. Ce comparatif complet explore leurs architectures, leurs mesures de performance et leurs scénarios de déploiement idéaux pour t'aider à prendre des décisions éclairées pour ton prochain projet d'IA.

Link to this sectionAperçus des modèles#

Comprendre les origines et les objectifs de conception principaux de chaque modèle fournit un contexte essentiel sur leurs réalisations techniques respectives.

Link to this sectionYOLOX#

Auteurs : Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, et Jian Sun
Organisation : Megvii
Date : 18-07-2021
Arxiv : 2107.08430
GitHub : Megvii-BaseDetection/YOLOX
Docs : YOLOX ReadTheDocs

Introduit mi-2021, YOLOX a représenté un changement majeur en adoptant une conception sans ancres associée à une tête découplée et à la stratégie avancée d'assignation de labels connue sous le nom de SimOTA. En s'éloignant des mécanismes traditionnels de boîtes ancres qui dominaient les architectures précédentes, YOLOX a réussi à combler le fossé entre la recherche académique et l'application industrielle, offrant un cadre élégant et hautement efficace pour la détection d'objets.

En savoir plus sur YOLOX

Link to this sectionYOLO26#

Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 14-01-2026
GitHub : ultralytics/ultralytics
Plateforme : Ultralytics Platform

Sorti début 2026, YOLO26 est l'aboutissement d'années d'améliorations itératives, se concentrant fortement sur le déploiement en périphérie (edge) et la simplification des pipelines d'entraînement. Il introduit une conception de bout en bout sans NMS, éliminant complètement l'étape traditionnelle de post-traitement de suppression des non-maximaux (Non-Maximum Suppression). Cette avancée simplifie considérablement le déploiement du modèle sur divers matériels. De plus, en supprimant le module Distribution Focal Loss (DFL), YOLO26 atteint une latence nettement inférieure, renforçant son statut de choix privilégié pour les applications de vision par ordinateur modernes.

En savoir plus sur YOLO26

Link to this sectionInnovations architecturales#

Les architectures de ces deux modèles mettent en lumière la progression rapide des méthodologies d'apprentissage profond, en particulier concernant les fonctions de perte et le post-traitement.

Link to this sectionL'approche YOLOX#

YOLOX a découplé les tâches de classification et de régression dans sa tête de prédiction, ce qui a considérablement accéléré la convergence lors de l'entraînement. Sa nature sans ancres a réduit le nombre de paramètres de conception, atténuant le besoin d'un réglage complexe des ancres avant l'entraînement. Associé à l'algorithme d'assignation de labels SimOTA, YOLOX a obtenu des résultats de pointe pour son époque, notamment sur des benchmarks standards comme le jeu de données COCO.

Link to this sectionL'avantage de YOLO26#

YOLO26 porte l'efficacité architecturale à un niveau supérieur. La suppression du NMS réduit non seulement la latence d'inférence, mais garantit également des temps d'exécution constants et déterministes, un facteur critique pour les véhicules autonomes et la robotique.

Les innovations clés de YOLO26 incluent :

  • Optimiseur MuSGD : Inspiré des techniques d'entraînement des grands modèles de langage (LLM), cet hybride de SGD et de Muon garantit des entraînements exceptionnellement stables et une convergence plus rapide.
  • Inférence CPU jusqu'à 43 % plus rapide : En éliminant DFL et en rationalisant l'architecture réseau, YOLO26 est fortement optimisé pour les appareils en périphérie aux ressources limitées, des simples capteurs IoT aux cartes Raspberry Pi.
  • ProgLoss + STAL : Ces fonctions de perte avancées offrent des améliorations notables dans la reconnaissance de petits objets, ce qui est critique pour l'analyse d'imagerie aérienne et le contrôle qualité précis dans l'automatisation manufacturière.
Optimisation Edge-First

Si ton projet cible des systèmes embarqués ou des applications mobiles sans GPU dédiés, les performances CPU optimisées de YOLO26 offrent un avantage majeur, nécessitant beaucoup moins de surcharge computationnelle que les modèles de génération précédente.

Link to this sectionPerformances et benchmarks#

Lors de l'évaluation des modèles pour des environnements de production, l'analyse de l'équilibre entre précision, vitesse et complexité computationnelle est primordiale. Tu trouveras ci-dessous une comparaison détaillée des modèles standards évalués à une taille d'image de 640 pixels (et 416 pour les variantes nano/tiny).

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040,938.91.72,45,4
YOLO26s64048,687.22.59,520,7
YOLO26m64053,1220.04.720,468,2
YOLO26l64055,0286.26.224,886,4
YOLO26x64057.5525.811.855,7193,9

Comme l'illustre le tableau, la série YOLO26 offre un équilibre de performance supérieur. Par exemple, YOLO26x atteint un impressionnant 57.5 mAP tout en utilisant près de la moitié des paramètres du modèle YOLOXx, ce qui se traduit directement par des temps d'inférence GPU plus rapides (11.8 ms contre 16.1 ms) et une flexibilité de déploiement largement supérieure.

Link to this sectionExpérience d'entraînement et écosystème#

L'une des différences les plus profondes entre ces architectures réside dans leur facilité d'utilisation et le support de leur écosystème.

Bien que YOLOX reste un référentiel fondamental pour les chercheurs étudiant le flux de gradient et la mécanique sans ancres, sa configuration peut être complexe, nécessitant souvent une configuration manuelle des dépendances et des opérateurs. À l'inverse, l'écosystème Ultralytics définit la norme de l'industrie en matière de facilité d'utilisation.

En utilisant l'API Python unifiée, tu peux initialiser, entraîner et déployer des modèles YOLO26 avec une simplicité inégalée. Le système gère nativement le téléchargement des jeux de données, le réglage des hyperparamètres et l'exportation transparente vers des formats tels qu'ONNX, TensorRT et OpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

De plus, les modèles Ultralytics YOLO nécessitent beaucoup moins de mémoire pendant l'entraînement par rapport aux alternatives lourdes basées sur des Transformers, permettant aux ingénieurs d'entraîner des tailles de batch plus importantes même sur du matériel grand public.

Link to this sectionApplications concrètes#

Le choix entre YOLOX et YOLO26 dépend en fin de compte de tes contraintes de déploiement et de tes exigences multi-tâches.

Link to this sectionOù YOLOX excelle#

YOLOX reste un candidat viable pour des benchmarks académiques spécifiques et des systèmes existants profondément intégrés au cadre MegEngine. Sa portée historique en fait une base populaire pour la recherche sur les détecteurs sans ancres et les stratégies d'assignation personnalisées.

Link to this sectionOù YOLO26 excelle#

YOLO26 est fondamentalement conçu pour les applications industrielles modernes. Parce qu'il prend nativement en charge la segmentation d'instance, l'estimation de pose et les boîtes englobantes orientées (OBB), il est bien plus polyvalent que les moteurs de détection standards.

  • Commerce intelligent et inventaire : L'utilisation de la conception sans NMS garantit que les systèmes de paiement automatisés traitent les flux vidéo avec une latence ultra-faible, reconnaissant les produits sans le goulot d'étranglement des boucles de post-traitement.
  • Analyses par drone et aériennes : La perte d'angle spécialisée pour l'OBB et l'intégration de ProgLoss + STAL rendent YOLO26 inégalé pour détecter les objets tournés et les minuscules artefacts dans de vastes images satellites.
  • Systèmes de sécurité en périphérie : Avec son inférence CPU 43 % plus rapide, YOLO26 permet aux entreprises de déployer des analyses de sécurité robustes directement sur du matériel local peu coûteux, sans nécessiter de calcul cloud onéreux.

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLOX et YOLO26 dépend de tes exigences de projet spécifiques, de tes contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOX#

YOLOX est un choix solide pour :

  • Recherche sur la détection sans ancres : La recherche académique utilisant l'architecture propre et sans ancres de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou des fonctions de perte.
  • Appareils en périphérie ultra-légers : Le déploiement sur des microcontrôleurs ou du matériel mobile ancien où l'empreinte extrêmement réduite de la variante YOLOX-Nano (0.91 M de paramètres) est critique.
  • Études sur l'assignation de labels SimOTA : Les projets de recherche étudiant les stratégies d'assignation de labels basées sur le transport optimal et leur impact sur la convergence de l'entraînement.

Link to this sectionQuand choisir YOLO26#

YOLO26 est recommandé pour :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionExplorer d'autres modèles Ultralytics#

Si tu explores l'évolution de la vision par ordinateur, il existe d'autres modèles très performants au sein de la famille Ultralytics qui méritent d'être étudiés :

  • YOLO11 : Le prédécesseur immédiat de YOLO26, offrant des performances robustes et un large soutien de la communauté pour les environnements de production stables.
  • YOLOv8 : Une architecture éprouvée qui a établi la norme en matière de facilité d'utilisation et de flexibilité à travers des milliers de déploiements réels.

En conclusion, bien que YOLOX ait introduit des concepts cruciaux dans le paysage de la détection d'objets, le nouveau YOLO26 offre un saut générationnel en termes de vitesse, de précision et de simplicité de déploiement, ce qui en fait le choix définitif pour les développeurs et les entreprises avant-gardistes.

Contributeurs

Commentaires