Passer au contenu

YOLOX vs PP-YOLOE+ : comparaison technique complète

Lors de la conception d'un pipeline de vision par ordinateur robuste, le choix du modèle de détection d'objets approprié est une décision cruciale. Le paysage des détecteurs d'objets en temps réel est très concurrentiel, avec de nombreuses architectures qui s'efforcent d'offrir l'équilibre ultime entre la vitesse d'inférence et la précision de détection. Dans cette comparaison technique, nous évaluerons deux modèles de premier plan : YOLOX et PP-YOLOE+. En examinant leur conception architecturale, leurs méthodologies d'entraînement et leurs mesures de performance, nous souhaitons fournir aux développeurs et aux chercheurs les informations nécessaires pour choisir l'outil adapté à leurs environnements de déploiement.

Innovations architecturales et conception

Les deux modèles ont été conçus pour répondre à des problèmes spécifiques rencontrés dans YOLO précédentes YOLO , mais ils adoptent des approches fondamentalement différentes pour résoudre le compromis entre vitesse et précision.

YOLOX : Relier la recherche et l’industrie

Développé par Zheng Ge, Songtao Liu, Feng Wang, Zeming Li et Jian Sun chez Megvii, YOLOX a été lancé le 18 juillet 2021. Il a marqué un changement important dans la YOLO en adoptant pleinement une conception sans ancrage. Vous pouvez découvrir les recherches fondamentales dans leur article officiel Arxiv et le code source original dans le référentiel GitHub YOLOX.

YOLOX intègre une tête découplée, séparant les tâches de classification et de régression, ce qui améliore considérablement la vitesse de convergence pendant l'entraînement. De plus, il a introduit des stratégies avancées d'attribution d'étiquettes telles que SimOTA pour attribuer dynamiquement des échantillons positifs. Cela rend le modèle très efficace, en particulier dans les environnements d'IA de pointe où les ressources informatiques sont strictement limitées.

En savoir plus sur YOLOX

PP-YOLOE+ : détection industrielle haute performance

Présenté par les PaddlePaddle chez Baidu le 2 avril 2022, PP-YOLOE+ représente une évolution hautement optimisée de laYOLO . Décrit en détail dans leur publication Arxiv, PP-YOLOE+ est profondément intégré à l'écosystème Baidu et nécessite le PaddlePaddle . Les configurations du modèle sont disponibles dans le référentiel GitHub PaddleDetection.

PP-YOLOE+ s'appuie sur une puissante structure CSPRepResNet et utilise une tête alignée sur les tâches efficaces (ET-head) ainsi que l'apprentissage aligné sur les tâches (TAL). Cette architecture atteint une précision moyenne exceptionnelle (mAP) sur COCO , ce qui en fait un choix formidable pour la détection des défauts industriels et le traitement lourd côté serveur, où la précision est prioritaire par rapport aux dépendances minimales.

En savoir plus sur PP-YOLOE+

Bancs d'essai de performance

Il est essentiel de comprendre comment ces modèles fonctionnent à différentes échelles pour pouvoir les déployer. Le tableau ci-dessous présente les indicateurs clés, notamment mAP et les vitesses d'inférence lors de l'exportation vers TensorRT.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Considérations relatives au déploiement

Alors que PP-YOLOE+x atteint la plus grande précision absolue, YOLOX propose des variantes extrêmement légères (Nano et Tiny) qui conviennent parfaitement aux microcontrôleurs à faible consommation et au matériel mobile traditionnel.

Cas d'utilisation et recommandations

Le choix entre YOLOX et PP-YOLOE+ dépend des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.

Quand choisir YOLOX

YOLOX est un choix judicieux pour :

  • Recherche sur la détection sans ancrage : recherche universitaire utilisant l'architecture propre et sans ancrage de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou fonctions de perte.
  • Dispositifs périphériques ultra-légers : déploiement sur des microcontrôleurs ou du matériel mobile existant où l'empreinte extrêmement réduite (0,91 M de paramètres) de la variante YOLOX-Nano est essentielle.
  • Études sur l'attribution des étiquettes SimOTA : projets de recherche visant à étudier les stratégies optimales d'attribution des étiquettes basées sur le transport et leur impact sur la convergence de l'apprentissage.

Quand choisir PP-YOLOE+

PP-YOLOE+ est recommandé pour :

  • IntégrationPaddlePaddle : organisations disposant d'une infrastructure existante basée sur le cadre et les outils PaddlePaddle de Baidu.
  • Déploiement Paddle Lite Edge : déploiement sur du matériel avec des noyaux d'inférence hautement optimisés spécialement conçus pour le moteur d'inférence Paddle Lite ou Paddle.
  • Détection côté serveur haute précision : scénarios donnant la priorité à une précision de détection maximale sur GPU puissants où la dépendance au framework n'est pas un problème.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Ultralytics : présentation de YOLO26

Si YOLOX et PP-YOLOE+ offrent tous deux des avantages distincts, l'évolution rapide de l'IA exige des outils qui combinent une précision de pointe et une facilité d'utilisation inégalée. C'est là qu'intervient Ultralytics , en particulier le modèle Ultralytics récemment lancé, surpassent les référentiels de recherche traditionnels.

Sorti en janvier 2026, YOLO26 établit une nouvelle norme pour la détection d'objets moderne et au-delà, offrant une expérience développeur tout simplement inégalée par les frameworks concurrents.

Pourquoi les développeurs choisissent YOLO26

  1. Conception NMS de bout en bout : s'appuyant sur les concepts mis au point dans YOLOv10, YOLO26 est nativement de bout en bout. En supprimant entièrement le post-traitementNMS(Non-Maximum Suppression), il garantit une latence très cohérente et simplifie considérablement les pipelines d'exportation pour les environnements périphériques.
  2. Optimisation nouvelle génération : la stabilité de l'entraînement est révolutionnée par l'optimiseur MuSGD, un hybride de SGD Muon (inspiré des méthodologies LLM telles que Kimi K2 de Moonshot AI). Cela garantit une convergence plus rapide. De plus, YOLO26 utilise ProgLoss + STAL pour améliorer considérablement la reconnaissance des petits objets, une fonctionnalité cruciale pour les applications impliquant l'imagerie aérienne et la robotique.
  3. Efficacité matérielle inégalée : en supprimant la perte focale de distribution (DFL), YOLO26 réduit considérablement les besoins en mémoire. Il offre CPU jusqu'à 43 % plus rapide, ce qui en fait le choix idéal pour les appareils ne disposant pas de GPU dédié. GPU .
  4. Extrême polyvalence : contrairement à PP-YOLOE+, qui se concentre strictement sur la détection, YOLO26 offre une prise en charge unifiée pour de nombreuses tâches. Il intègre une perte de segmentation sémantique spécialisée pour la segmentation d'instances, l'estimation de la vraisemblance logarithmique résiduelle (RLE) pour une estimation précise de la pose, et des mécanismes avancés de perte d'angle pour les boîtes englobantes orientées (OBB).

En savoir plus sur YOLO26

Intégration transparente dans l'écosystème

Ultralytics la frustration liée à l'installation de frameworks complexes. Grâce à Python unifiée ou à la Ultralytics intuitive Ultralytics , vous pouvez entraîner, valider et exporter des modèles en quelques lignes de code seulement.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Pour les utilisateurs qui évaluent d'autres architectures robustes au sein de Ultralytics , YOLO11 reste un choix très fiable pour les déploiements existants, tandis que le RT-DETR offre d'excellentes capacités pour ceux qui recherchent des solutions basées sur l'attention.

Résumé

Le choix entre YOLOX et PP-YOLOE+ dépend souvent des contraintes de votre infrastructure principale : préférez-vous la flexibilité PyTorch ou l'intégration approfondie avec PaddlePaddle de Baidu ? Cependant, pour les organisations qui souhaitent pérenniser leur infrastructure d'IA, Ultralytics offre une alternative nettement supérieure. Grâce à sa conception révolutionnaire NMS, son faible encombrement mémoire et sa polyvalence complète, YOLO26 permet aux équipes de créer des applications de vision par ordinateur plus rapides, plus intelligentes et plus efficaces avec une facilité sans précédent.


Commentaires