Passer au contenu

YOLO11 YOLOX : évolution de la détection d'objets haute performance

Le domaine de la vision par ordinateur a connu des progrès rapides au cours des dernières années, les modèles de détection d'objets en temps réel devenant de plus en plus sophistiqués. Lorsqu'ils choisissent une architecture pour un environnement de production ou la recherche universitaire, les développeurs évaluent souvent les compromis entre les avancées historiques et les innovations de pointe. Cette comparaison exhaustive explore les différences entre Ultralytics YOLO11 et YOLOX de Megvii, en fournissant des informations approfondies sur leurs architectures, leurs mesures de performance et leurs scénarios de déploiement idéaux.

Aperçu architectural

Les deux modèles représentent des avancées significatives en détection d'objets, mais ils proviennent de philosophies de conception différentes et ciblent des expériences de développeur différentes.

YOLO11: le moteur polyvalent multitâche

Publié en septembre 2024 par Glenn Jocher et Jing Qiu chez Ultralytics, YOLO11 est conçu comme un cadre unifié qui allie haute précision et efficacité extrême.

YOLO11 au-delà des boîtes englobantes standard, prenant en charge de manière native la segmentation d'instances, la classification d'images, l'estimation de pose et la détection de boîtes englobantes orientées (OBB). Son architecture raffinée optimise l'extraction de caractéristiques afin d'assurer une meilleure conservation des caractéristiques dans les hiérarchies spatiales complexes.

En savoir plus sur YOLO11

YOLOX : Le pionnier sans ancrage

Développé par des chercheurs de Megvii, YOLOX a suscité une attention considérable en 2021 en comblant le fossé entre la recherche et les applications industrielles grâce à une approche purement sans ancres.

YOLOX a introduit une tête découplée et un paradigme sans ancrage, ce qui a considérablement réduit le nombre de paramètres de conception et amélioré les performances sur les benchmarks académiques au moment de sa sortie.

En savoir plus sur YOLOX

Le saviez-vous ?

La conception sans ancrage popularisée par YOLOX a inspiré de nombreuses architectures ultérieures. Ultralytics et considérablement affiné ces concepts sans ancrage dans des itérations ultérieures telles que YOLOv8 et YOLO11 offrir une précision et une flexibilité de déploiement supérieures.

Performance et indicateurs

Lors de l'évaluation des modèles de détection, il est essentiel d'examiner l'équilibre entre les paramètres, le coût de calcul (FLOP) et la précision moyenne (mAP) pour le déploiement du modèle dans le monde réel.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Comme le montre le tableau, YOLO11x surpasse significativement YOLOXx en précision absolue (54,7 mAP contre 51,1 mAP), tout en nécessitant environ la moitié des paramètres (56,9M contre 99,1M). Cette efficacité se traduit par des exigences de mémoire réduites pendant l'entraînement et l'inférence, un avantage considérable pour les environnements de production.

Écosystème et expérience du développeur

L'avantage Ultralytics

L'une des différences les plus marquantes entre YOLO11 YOLOX réside dans leur facilité d'utilisation. YOLOX fonctionne principalement comme une base de code de recherche, nécessitant une configuration complexe de l'environnement, une compilation manuelle des opérateurs C++ et des arguments de ligne de commande détaillés pour lancer l'entraînement d'un ensemble de données personnalisé.

À l'opposé, YOLO11 entièrement intégré auPython Ultralytics , offrant un workflow simplifié, « de zéro à héros ». La Ultralytics propose des outils complets pour l'annotation des données, le suivi des expériences et la formation basée sur le cloud, éliminant ainsi les tâches répétitives afin que les ingénieurs puissent se concentrer sur les performances des modèles.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

De plus, l'exportation d'un Ultralytics vers des formats tels que TensorRT, CoreML ou OpenVINO ne nécessite qu'une seule commande, alors que les référentiels hérités exigent souvent des outils tiers complexes ou des manipulations manuelles des graphiques.

Cas d'utilisation concrets

Quand envisager YOLOX

YOLOX reste une option valable pour les déploiements spécialisés et hérités, dans lesquels les développeurs ont déjà créé des pipelines d'inférence C++ hautement personnalisés autour de ses tensor de tête découplées spécifiques. De plus, les chercheurs qui mènent des études comparatives avec les architectures de pointe de 2021 continueront d'utiliser YOLOX comme base de référence pour leurs ensembles de données.

Où YOLO11 excelle

Dans presque tous les scénarios de production modernes, YOLO11 une expérience bien supérieure :

  • Villes Intelligentes et Commerce de Détail: Grâce à son rapport vitesse-précision exceptionnel, YOLO11 gère les scènes encombrées sans effort, alimentant les analyses automatisées du commerce de détail et les systèmes de gestion du trafic sans nécessiter de clusters GPU massifs.
  • Calcul en périphérie : La grande efficacité de la mémoire et les options d'exportation robustes rendent YOLO11 parfait pour les déploiements d'IA en périphérie sur des appareils comme le Raspberry Pi ou les plateformes NVIDIA Jetson.
  • Pipelines complexes : Si un projet exige de combiner la détection d'objets avec des points clés de pose (par exemple, l'analyse sportive) ou une segmentation d'instance précise (par exemple, l'imagerie médicale), YOLO11 gère toutes les tâches nativement via une API unifiée.

Cas d'utilisation et recommandations

Le choix entre YOLO11 et YOLOX dépend des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de l'écosystème.

Quand choisir YOLO11

YOLO11 un excellent choix pour :

  • Déploiement Edge en production : Applications commerciales sur des appareils comme le Raspberry Pi ou le NVIDIA Jetson, où la fiabilité et une maintenance active sont primordiales.
  • Applications de vision multi-tâches : Projets nécessitant la détection, la segmentation, l'estimation de pose et les OBB au sein d'un cadre unifié unique.
  • Prototypage et Déploiement Rapides : Les équipes qui ont besoin de passer rapidement de la collecte de données à la production en utilisant l'API Python rationalisée d'Ultralytics.

Quand choisir YOLOX

YOLOX est recommandé pour :

  • Recherche sur la détection sans ancres : Recherche académique utilisant l'architecture propre et sans ancres de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou fonctions de perte.
  • Appareils Edge Ultra-Légers : Déploiement sur des microcontrôleurs ou du matériel mobile hérité où l'empreinte extrêmement réduite (0,91M paramètres) de la variante YOLOX-Nano est critique.
  • Études d'assignation d'étiquettes SimOTA: Projets de recherche étudiant les stratégies d'assignation d'étiquettes basées sur le transport optimal et leur impact sur la convergence de l'entraînement.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • Déploiement Edge sans NMS : Applications nécessitant une inférence cohérente et à faible latence, sans la complexité du post-traitement de la Non-Maximum Suppression.
  • Environnements uniquement CPU : Les appareils sans accélération GPU dédiée, où l'inférence CPU de YOLO26, jusqu'à 43 % plus rapide, offre un avantage décisif.
  • Détection de petits objets: Scénarios difficiles comme l'imagerie aérienne par drone ou l'analyse de capteurs IoT où ProgLoss et STAL augmentent significativement la précision sur les objets minuscules.

Perspectives : La puissance de YOLO26

Si YOLO11 un choix exceptionnel, le paysage de l'IA ne cesse d'évoluer. Pour les équipes à la recherche d'une efficacité et d'une stabilité optimales, YOLO26 (sorti en janvier 2026) est la recommandation ultime pour les nouveaux projets de vision par ordinateur.

YOLO26 représente une avancée considérable grâce à la mise en œuvre d'une conception NMS de bout en bout. En éliminant le post-traitement NMS(Non-Maximum Suppression), il supprime complètement la variabilité de la latence, simplifiant considérablement la logique de déploiement, un concept lancé pour la première fois dans YOLOv10.

De plus, YOLO26 intègre la fonction DFL Removal (Distribution Focal Loss), qui optimise l'architecture pour atteindre CPU jusqu'à 43 % plus rapide, ce qui en fait le champion incontesté des appareils à faible consommation et des appareils périphériques. La stabilité de l'entraînement est également renforcée grâce à l'optimiseur MuSGD, un hybride inspiré du LLM, du SGD du Muon qui accélère la convergence. Associé à des fonctions de perte avancées telles que ProgLoss + STAL, YOLO26 excelle dans la détection de petits objets dans des environnements difficiles tels que les images de drones et les capteurs IoT périphériques.

Exploration approfondie

Vous souhaitez approfondir vos connaissances sur les architectures de détection d'objets ? Découvrez les capacités de vocabulaire ouvert de YOLO ou plongez-vous dans le RT-DETR documenté dans l'Ultralytics .

En conclusion, bien que YOLOX ait introduit des concepts architecturaux importants en 2021, l'ensemble complet d'outils, l'efficacité mémoire et les performances de pointe de YOLO11, et en particulier l'architecture révolutionnaire de YOLO26, font de Ultralytics le choix évident pour les chercheurs et les développeurs d'entreprise aujourd'hui.


Commentaires