Passer au contenu

YOLO11 vs YOLOX : Une comparaison technique

Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre la précision, la vitesse et la facilité de mise en œuvre. Cette page fournit une comparaison technique détaillée entre Ultralytics YOLO11, le dernier modèle de pointe d'Ultralytics, et YOLOX, un modèle sans ancrage important de Megvii. Bien que les deux modèles aient fait progresser le domaine de la détection d'objets en temps réel, YOLO11 offre une solution plus complète, polyvalente et conviviale, soutenue par un écosystème robuste et activement maintenu.

Ultralytics YOLO11 : Performances et polyvalence de pointe

Ultralytics YOLO11 est le nouveau modèle phare d’Ultralytics, conçu pour offrir des performances et une flexibilité inégalées dans un large éventail de tâches de vision par ordinateur. Créé par Glenn Jocher et Jing Qiu, il s’appuie sur les bases solides des modèles précédents tels que YOLOv8 et introduit d’importantes améliorations architecturales pour une précision et une efficacité supérieures.

Architecture et principales fonctionnalités

YOLO11 dispose d'une architecture sans ancres hautement optimisée qui améliore l'extraction des caractéristiques et rationalise le processus de détection. Cette conception permet d'obtenir un meilleur compromis entre la vitesse et la précision, en atteignant souvent des scores de mAP plus élevés avec moins de paramètres et un coût de calcul inférieur à celui des autres modèles.

Un avantage clé de YOLO11 est sa polyvalence. Il ne s’agit pas seulement d’un détecteur d’objets, mais d’un framework d’IA de vision complet prenant en charge plusieurs tâches prêtes à l’emploi, notamment la segmentation d’instances, la classification d’images, l’estimation de pose et la détection de boîtes englobantes orientées (OBB).

Points forts

  • Performance supérieure : Atteint une précision et une vitesse de pointe, surpassant de nombreux concurrents à des tailles de modèles similaires.
  • Facilité d'utilisation : Fourni avec une API Python et une CLI simples, une documentation exhaustive et de nombreux tutoriels qui le rendent accessible aux débutants comme aux experts.
  • Écosystème bien maintenu : Bénéficie d'un développement continu, d'une forte communauté sur GitHub et Discord, et de mises à jour fréquentes. L'intégration avec des outils tels que Ultralytics HUB offre une expérience MLOps transparente.
  • Efficacité de l'entraînement : Offre des processus d'entraînement efficaces avec des poids pré-entraînés facilement disponibles, permettant une convergence plus rapide. Il a également des besoins en mémoire inférieurs pendant l'entraînement et l'inférence par rapport aux architectures plus complexes comme les transformateurs.
  • Polyvalence multi-tâches : Un seul cadre peut être utilisé pour un large éventail de tâches de vision, ce qui réduit la complexité et le temps de développement.
  • Flexibilité de déploiement : Optimisé pour divers matériels, des périphériques périphériques aux serveurs cloud, avec prise en charge de nombreux formats d'exportation tels que ONNX et TensorRT.

Faiblesses

  • En tant que modèle de pointe, les variantes plus grandes comme YOLO11x peuvent être gourmandes en calcul, nécessitant un matériel puissant pour des performances en temps réel.
  • Bien que l'écosystème soit robuste, certaines intégrations d'outils tiers de niche peuvent être plus matures pour les modèles plus anciens et mieux établis.

Cas d'utilisation idéaux

Le mélange de haute précision, de vitesse et de polyvalence de YOLO11 en fait le choix idéal pour un large éventail d'applications :

En savoir plus sur YOLO11

YOLOX : Une approche sans ancrage

YOLOX, développé par Megvii, a été une contribution notable à la famille YOLO, introduisant une conception sans ancrage pour simplifier le pipeline de détection et améliorer les performances par rapport à ses prédécesseurs.

Architecture et principales fonctionnalités

Les principales innovations de YOLOX comprennent son détecteur sans ancrage, une tête découplée pour la classification et la régression, et une stratégie avancée d'attribution d'étiquettes appelée SimOTA. Ces changements visaient à créer un détecteur d'objets plus rationalisé et efficace.

Points forts

  • Haute précision : YOLOX offre des scores mAP compétitifs, en particulier avec ses variantes de modèles plus grandes.
  • Simplicité sans ancres : En éliminant les boîtes d’ancrage prédéfinies, elle réduit le nombre d’hyperparamètres qui doivent être réglés, ce qui peut améliorer la généralisation.
  • Modèle établi : Ayant été publié en 2021, il a une communauté et a été adapté dans divers projets.

Faiblesses

  • Polyvalence limitée : YOLOX est principalement conçu pour la détection d’objets. Il ne prend pas en charge nativement d’autres tâches telles que la segmentation, l’estimation de pose et l’OBB qui sont standard dans YOLO11.
  • Écosystème fragmenté : Bien qu'il soit open source, il ne possède pas l'écosystème unifié et bien maintenu qu'Ultralytics fournit. Les utilisateurs pourraient avoir à fournir plus d'efforts pour l'intégrer avec les outils MLOps et pour le déploiement.
  • Écarts de performance : Comme le montre le tableau des performances, les modèles YOLOX peuvent être plus lents et moins précis que leurs homologues YOLO11. Par exemple, YOLOX-l est surpassé par YOLO11l en mAP tout en ayant beaucoup plus de paramètres et de FLOP.
  • Performance du CPU : Les benchmarks pour l'inférence CPU ne sont pas facilement disponibles, ce qui rend difficile l'évaluation de ses performances dans les scénarios liés au CPU, où YOLO11 fournit des mesures claires.

Cas d'utilisation idéaux

YOLOX est un choix judicieux pour les projets qui nécessitent spécifiquement :

  • Détection d'objets haute performance : Dans les scénarios où l'objectif principal est la précision pure de la détection d'objets.
  • Base de référence pour la recherche : En tant que modèle de base pour la recherche sur les méthodes de détection sans ancres.
  • Applications industrielles : Pour les tâches telles que le contrôle qualité où un détecteur d’objets dédié est suffisant.

En savoir plus sur YOLOX

Analyse des performances : YOLO11 vs YOLOX

La comparaison des performances démontre clairement les avancées réalisées par Ultralytics YOLO11. Pour toutes les tailles de modèles, YOLO11 offre systématiquement un meilleur équilibre entre la précision et l'efficacité.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
  • Précision : Les modèles YOLO11 atteignent systématiquement des scores mAP plus élevés que leurs homologues YOLOX. Par exemple, YOLO11m atteint 51,5 mAP, surpassant considérablement les 46,9 mAP de YOLOXm avec moins de paramètres.
  • Efficacité : YOLO11 démontre une efficacité supérieure. YOLO11l atteint un mAP de 53,4 avec seulement 25,3 millions de paramètres, tandis que YOLOXl nécessite 54,2 millions de paramètres pour atteindre un mAP inférieur de 49,7.
  • Vitesse : YOLO11 est optimisé pour l'inférence sur CPU et GPU. Son plus petit modèle, YOLO11n, affiche une latence impressionnante de 1,5 ms sur un GPU T4, ce qui le rend idéal pour les applications en temps réel. Les vitesses rapportées de YOLOX sont plus lentes pour les modèles comparables.

Conclusion et recommandation

Bien que YOLOX ait été un développement important dans la détection d'objets sans ancrage, Ultralytics YOLO11 est le grand gagnant pour les développeurs et les chercheurs à la recherche de la meilleure combinaison de performances, de polyvalence et de convivialité.

YOLO11 surpasse non seulement YOLOX dans les indicateurs clés comme la précision et l'efficacité, mais offre également un écosystème beaucoup plus complet et favorable. Sa capacité à gérer plusieurs tâches de vision au sein d'un cadre unique et facile à utiliser en fait un choix plus pratique et puissant pour la construction de solutions d'IA modernes. Pour tout nouveau projet, du prototypage rapide au déploiement à l'échelle de la production, Ultralytics YOLO11 est le modèle recommandé.

Autres comparaisons de modèles

Si vous souhaitez savoir comment YOLO11 et YOLOX se comparent à d'autres modèles, consultez ces pages de comparaison :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires