Passer au contenu

YOLO26 vs YOLOX : Faire progresser la détection d'objets en temps réel

Dans le paysage en rapide évolution de la vision par ordinateur, le choix du modèle adapté à votre application est crucial. Ce guide propose une comparaison technique approfondie entre Ultralytics YOLO26, le dernier modèle de pointe pour les applications embarquées et en temps réel, et YOLOX, un détecteur sans ancres (anchor-free) haute performance publié en 2021 par Megvii. Nous analysons leurs architectures, leurs métriques de performance et leur aptitude au déploiement afin de vous aider à prendre des décisions éclairées pour vos projets.

Aperçu des modèles

Avant d'aborder les spécificités techniques, il est essentiel de comprendre les origines et les philosophies fondamentales qui ont guidé le développement de chaque modèle.

Ultralytics YOLO26

Publié en janvier 2026 par Glenn Jocher et Jing Qiu chez Ultralytics, YOLO26 représente un bond significatif en matière d'efficacité et de convivialité. Conçu spécifiquement pour les appareils embarqués et à faible consommation, il introduit une architecture native de bout en bout sans NMS. Cette conception élimine le besoin de post-traitement par suppression non maximale (NMS), un goulot d'étranglement courant dans les pipelines de déploiement.

Les innovations clés incluent l'optimiseur MuSGD—inspiré par Kimi K2 de Moonshot AI—qui adapte les techniques d'entraînement des grands modèles de langage (LLM) aux tâches de vision, et la suppression de la Distribution Focal Loss (DFL) pour simplifier les processus d'exportation. Avec une inférence CPU jusqu'à 43 % plus rapide par rapport à ses prédécesseurs, YOLO26 excelle dans les scénarios nécessitant une vitesse élevée sans accélération GPU.

En savoir plus sur YOLO26

YOLOX

YOLOX, développé par des chercheurs de Megvii en 2021, a été une publication pivot qui a popularisé le paradigme de détection sans ancres (anchor-free) au sein de la famille YOLO. En découplant la tête de prédiction et en utilisant SimOTA pour l'attribution des étiquettes, YOLOX a atteint une précision compétitive et a remporté le Streaming Perception Challenge lors du workshop CVPR 2021. Il reste un modèle respecté dans la communauté de recherche pour sa conception épurée et son efficacité dans les environnements GPU haute performance.

En savoir plus sur YOLOX

Comparaison des performances

Lors de l'évaluation des détecteurs d'objets, le compromis entre la vitesse (latence) et la précision (mAP) est primordial. YOLO26 présente des avantages significatifs sur ces deux métriques, en particulier sur le matériel basé sur CPU.

Analyse des métriques

Le tableau suivant met en évidence les performances de différentes échelles de modèles sur le jeu de données COCO.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Interprétation des performances

YOLO26 surpasse constamment YOLOX à toutes les échelles en termes de précision (mAP). Par exemple, YOLO26s atteint 48,6 mAP contre 40,5 mAP pour YOLOX-s, une amélioration substantielle pour des modèles de taille similaire. De plus, la conception native de bout en bout de YOLO26 garantit que les vitesses indiquées reflètent le temps d'inférence total, tandis que les benchmarks traditionnels excluent souvent le temps de NMS.

Différences architecturales clés

1. De bout en bout vs. Post-traitement

L'une des différences les plus marquantes réside dans le pipeline d'inférence.

  • YOLO26 : Nativement de bout en bout. En employant des techniques d'entraînement avancées, il prédit le nombre exact d'objets sans nécessiter de suppression non maximale (NMS). C'est une avancée majeure pour le déploiement, car la NMS est souvent difficile à accélérer sur les NPU et les processeurs embarqués.
  • YOLOX : Repose sur la NMS. Bien qu'il ait introduit un mécanisme sans ancres (anchor-free) pour simplifier la tête, la sortie brute contient toujours des boîtes superposées qui doivent être filtrées, ajoutant de la latence et de la complexité lors de l'exportation du modèle vers des formats comme TensorRT ou CoreML.

2. Fonctions de perte et optimisation

YOLO26 introduit ProgLoss (Progressive Loss Balancing) et STAL (Small-Target-Aware Label Assignment). Ces innovations ciblent spécifiquement la détection de petits objets, une faiblesse courante des détecteurs précédents. De plus, YOLO26 utilise l'optimiseur MuSGD, un hybride de SGD et de Muon, qui stabilise l'entraînement significativement plus rapidement que les optimiseurs standards utilisés dans YOLOX.

3. Optimisation pour l'embarqué

YOLO26 supprime explicitement le module Distribution Focal Loss (DFL). Bien que le DFL (utilisé dans des modèles comme YOLOv8) améliore la précision des boîtes, il repose sur des opérations qui peuvent être lentes sur certains matériels. En le supprimant, YOLO26 réalise une inférence CPU jusqu'à 43 % plus rapide, ce qui en fait le choix supérieur pour Raspberry Pi, les CPU mobiles et d'autres environnements à ressources limitées.

Facilité d'utilisation et écosystème

Pour les développeurs, les fonctionnalités "douces" d'un modèle—documentation, qualité de l'API et support—sont aussi importantes que les métriques brutes.

L'avantage Ultralytics

YOLO26 est intégré à l'écosystème robuste d'Ultralytics. Cela garantit :

Écosystème YOLOX

YOLOX offre une implémentation PyTorch solide et prend en charge des formats comme ONNX et TensorRT. Cependant, il nécessite généralement plus de code passe-partout pour l'entraînement et l'inférence par rapport au ultralytics package. Son écosystème est moins centralisé, obligeant souvent les utilisateurs à gérer manuellement les augmentations de données et les scripts de déploiement qui sont fournis en standard avec les modèles Ultralytics.

Comparaison de code

La différence en termes de convivialité est mieux illustrée par le code.

Entraînement de YOLO26 avec Ultralytics :

from ultralytics import YOLO

# Load model and train on COCO8 dataset
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Entraînement de YOLOX (implémentation standard) :Nécessite le clonage du dépôt, l'installation de dépendances spécifiques, la préparation du jeu de données dans une structure de répertoires spécifique et l'exécution de commandes CLI complexes.

# Example YOLOX training command (conceptual)
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth

Cas d'utilisation idéaux

Quand choisir YOLO26

  • Déploiement en périphérie : Si vous déployez sur des appareils mobiles, des capteurs IoT ou des CPU où l'accélération TensorRT ou NPU est limitée.
  • Tâches complexes : Lorsque votre projet nécessite la segmentation, l'estimation de pose ou la détection d'objets orientés (obb) en plus de la détection standard.
  • Développement rapide : Lorsque vous devez itérer rapidement à l'aide d'une API stable et bien documentée avec un support intégré pour la gestion des jeux de données.
  • Détection de petits objets : Applications comme l'imagerie aérienne ou le contrôle qualité où la prédiction de petites cibles est cruciale.

Quand envisager YOLOX

  • Recherche existante : Si vous reproduisez des résultats académiques de 2021-2022 qui se comparent spécifiquement au papier original de YOLOX.
  • Personnalisation spécifique : Si vous avez un pipeline existant fortement personnalisé autour de l'architecture YOLOX spécifique et que le coût de migration est prohibitif.

Conclusion

Bien que YOLOX reste une étape importante dans l'histoire de la détection d'objets sans ancre, YOLO26 offre une solution plus complète pour les applications d'IA modernes. Grâce à son architecture native de bout en bout, son rapport précision-vitesse supérieur et le soutien de l'écosystème Ultralytics, YOLO26 est le choix recommandé pour les nouveaux projets et la mise à niveau des déploiements existants.

La combinaison de la stabilité d'entraînement MuSGD, de l'efficacité sans DFL et de la polyvalence des tâches garantit que YOLO26 non seulement detect les objets plus rapidement, mais simplifie également l'ensemble du cycle de vie de l'apprentissage automatique, de l'entraînement au déploiement.

Lectures complémentaires

Pour ceux qui souhaitent explorer d'autres modèles de la famille YOLO, considérez les options suivantes :

  • YOLO11 : Le prédécesseur de YOLO26, offrant d'excellentes performances et une large compatibilité.
  • YOLOv10 : La première itération à introduire l'entraînement sans NMS, ouvrant la voie aux avancées de YOLO26.
  • YOLO World : Pour les tâches de détection à vocabulaire ouvert où vous devez detect des objets non présents dans le jeu d'entraînement.

Commentaires