Passer au contenu

YOLOX vs YOLO26 : l'évolution de la détection d'objets sans ancrage à la détection d'objets de bout en bout

Le domaine de la vision par ordinateur a connu des transformations incroyables au cours de la dernière décennie. Deux étapes importantes ont marqué cette évolution : la sortie de YOLOX, qui a popularisé les architectures sans ancrage, et le lancement récent Ultralytics , qui redéfinit complètement les performances en temps réel grâce à une conception native de bout en bout, NMS. Cette comparaison complète explore leurs architectures, leurs mesures de performance et leurs scénarios de déploiement idéaux afin d'aider les développeurs à prendre des décisions éclairées pour leur prochain projet d'IA.

Aperçus des modèles

Comprendre les origines et les principaux objectifs de conception de chaque modèle fournit un contexte essentiel pour appréhender leurs avancées techniques respectives.

YOLOX

Auteurs : Zheng Ge, Songtao Liu, Feng Wang, Zeming Li et Jian Sun
Organisation : Megvii
Date : 18/07/2021
Arxiv : 2107.08430
GitHub : Megvii-BaseDetection/YOLOX
Documentation : YOLOX ReadTheDocs

Lancé mi-2021, YOLOX a marqué un tournant majeur en adoptant une conception sans ancrage associée à une tête découplée et à une stratégie avancée d'attribution d'étiquettes connue sous le nom de SimOTA. En s'éloignant des mécanismes traditionnels de boîte d'ancrage qui dominaient les architectures précédentes, YOLOX a réussi à combler le fossé entre la recherche universitaire et l'application industrielle, offrant un cadre élégant et très efficace pour la détection d'objets.

En savoir plus sur YOLOX

YOLO26

Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 14/01/2026
GitHub : ultralytics
Plateforme : Ultralytics

Sorti début 2026, YOLO26 est l'aboutissement d'années d'améliorations itératives, axées principalement sur le déploiement en périphérie et la simplification des pipelines de formation. Il introduit une conception de bout en bout NMS, éliminant complètement l'étape traditionnelle de post-traitement de suppression non maximale. Cette avancée simplifie considérablement le déploiement des modèles sur divers matériels. De plus, en supprimant le module DFL (Distribution Focal Loss), YOLO26 atteint une latence nettement inférieure, consolidant ainsi son statut de choix privilégié pour les applications modernes de vision par ordinateur.

En savoir plus sur YOLO26

Innovations architecturales

Les architectures de ces deux modèles mettent en évidence la progression rapide des méthodologies d'apprentissage profond, en particulier en ce qui concerne les fonctions de perte et le post-traitement.

L'approche YOLOX

YOLOX a découplé les tâches de classification et de régression dans son module de prédiction, ce qui a considérablement accéléré la convergence pendant l'entraînement. Son caractère sans ancrage a réduit le nombre de paramètres de conception, atténuant ainsi la nécessité d'un réglage complexe des ancrages avant l'entraînement. Associé à l'algorithme d'attribution d'étiquettes SimOTA, YOLOX a obtenu des résultats à la pointe de la technologie pour l'époque, en particulier sur des benchmarks standard tels que COCO .

L'avantage YOLO26

YOLO26 fait passer l'efficacité architecturale à un niveau supérieur. La suppression du NMS réduit NMS seulement la latence d'inférence, mais garantit également des temps d'exécution cohérents et déterministes, un facteur essentiel pour les véhicules autonomes et la robotique.

Les principales innovations du YOLO26 comprennent :

  • Optimiseur MuSGD : inspiré des techniques d'entraînement des grands modèles linguistiques (LLM), cet hybride de SGD Muon garantit des cycles d'entraînement exceptionnellement stables et une convergence plus rapide.
  • CPU jusqu'à 43 % plus rapide : en éliminant le DFL et en rationalisant l'architecture réseau, YOLO26 est fortement optimisé pour les appareils périphériques aux ressources limitées, des simples capteurs IoT aux cartes Raspberry Pi.
  • ProgLoss + STAL : ces fonctions de perte avancées apportent des améliorations notables dans la reconnaissance des petits objets, ce qui est essentiel pour analyser les images aériennes et effectuer un contrôle qualité précis dans l'automatisation de la fabrication.

Optimisation Edge-First

Si votre projet cible des systèmes embarqués ou des applications mobiles sans GPU dédiés, CPU optimisées de YOLO26 offrent un avantage considérable, car elles nécessitent beaucoup moins de ressources informatiques que les modèles de la génération précédente.

Performances et analyses comparatives

Lors de l'évaluation des modèles pour les environnements de production, il est primordial d'analyser l'équilibre entre précision, vitesse et complexité computationnelle. Vous trouverez ci-dessous une comparaison détaillée des modèles standard évalués pour une taille d'image de 640 pixels (et 416 pour les variantes nano/tiny).

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Comme le montre le tableau, la série YOLO26 offre un équilibre de performances supérieur. Par exemple, YOLO26x atteint un impressionnant 57,5 mAP utilisant près de la moitié des paramètres du YOLOXx modèle, ce qui se traduit directement par des temps GPU plus rapides (11,8 ms contre 16,1 ms) et une flexibilité de déploiement nettement supérieure.

Formation et expérience de l'écosystème

L'une des différences les plus marquantes entre ces architectures réside dans leur facilité d'utilisation et leur prise en charge de l'écosystème.

Si YOLOX reste un référentiel fondamental pour les chercheurs qui étudient le flux de gradient et la mécanique sans ancrage, sa configuration peut s'avérer complexe, nécessitant souvent une configuration manuelle des dépendances et des opérateurs. À l'inverse, l' Ultralytics définit la norme industrielle en matière de facilité d'utilisation.

En utilisant Python unifiée, les développeurs peuvent initialiser, entraîner et déployer des modèles YOLO26 avec une simplicité inégalée. Le système gère de manière native le téléchargement des ensembles de données, le réglage des hyperparamètres et l'exportation transparente vers des formats tels que ONNX, TensorRTet OpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

De plus,YOLO Ultralytics nécessitent beaucoup moins de mémoire pendant l'entraînement que les alternatives lourdes basées sur des transformateurs, ce qui permet aux ingénieurs d'entraîner des lots plus importants, même sur du matériel grand public.

Applications concrètes

Le choix entre YOLOX et YOLO26 dépend en fin de compte de vos contraintes de déploiement et de vos exigences en matière de multitâche.

Les domaines dans lesquels YOLOX excelle

YOLOX reste un candidat viable pour certains benchmarks académiques spécifiques et les systèmes hérités fortement intégrés au framework MegEngine. Son importance historique en fait une base de référence populaire pour la recherche sur les détecteurs sans ancrage et les stratégies d'affectation personnalisées.

Points forts de YOLO26

YOLO26 est fondamentalement conçu pour les applications industrielles modernes. Comme il prend en charge nativement la segmentation d'instances, l'estimation de pose et les boîtes englobantes orientées (OBB), il est beaucoup plus polyvalent que les moteurs de détection standard.

  • Commerce intelligent et gestion des stocks : l'utilisation d'une conception NMS garantit que les systèmes de caisse automatisés traitent les flux vidéo avec une latence ultra-faible, reconnaissant les produits sans le goulot d'étranglement des boucles de post-traitement.
  • Analyse par drone et aérienne : la perte d'angle spécialisée pour OBB et l'intégration de ProgLoss + STAL rendent YOLO26 inégalé dans la détection d'objets pivotés et de minuscules artefacts dans de vastes images satellites.
  • Systèmes de sécurité périphériques : grâce à son CPU 43 % plus rapide, YOLO26 permet aux entreprises de déployer des analyses de sécurité robustes directement sur du matériel local peu coûteux, sans avoir recours à des ressources informatiques cloud onéreuses.

Cas d'utilisation et recommandations

Le choix entre YOLOX et YOLO26 dépend des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de l'écosystème.

Quand choisir YOLOX

YOLOX est un choix judicieux pour :

  • Recherche sur la détection sans ancrage : recherche universitaire utilisant l'architecture propre et sans ancrage de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou fonctions de perte.
  • Dispositifs périphériques ultra-légers : déploiement sur des microcontrôleurs ou du matériel mobile existant où l'empreinte extrêmement réduite (0,91 M de paramètres) de la variante YOLOX-Nano est essentielle.
  • Études sur l'attribution des étiquettes SimOTA : projets de recherche visant à étudier les stratégies optimales d'attribution des étiquettes basées sur le transport et leur impact sur la convergence de l'apprentissage.

Quand choisir YOLO26

YOLO26 est recommandé pour :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Explorer d'autres Ultralytics

Si vous vous intéressez à l'évolution de la vision par ordinateur, d'autres modèles très performants de la Ultralytics méritent d'être étudiés :

  • YOLO11: Le prédécesseur immédiat de YOLO26, offrant des performances robustes et un large soutien de la communauté pour des environnements de production stables.
  • YOLOv8: une architecture largement éprouvée qui a établi la norme en matière de facilité d'utilisation et de flexibilité dans des milliers de déploiements réels.

En conclusion, alors que YOLOX a introduit des concepts essentiels dans le domaine de la détection d'objets, le nouveau YOLO26 offre un bond en avant en termes de vitesse, de précision et de simplicité de déploiement, ce qui en fait le choix incontournable pour les développeurs et les entreprises avant-gardistes.


Commentaires