Passer au contenu

YOLOv5 YOLOX : comparaison technique complète

L'évolution de la vision par ordinateur en temps réel a connu de nombreuses étapes importantes, avec différentes architectures repoussant les limites de la vitesse et de la précision. Deux modèles très influents dans ce domaine sont YOLOv5 et YOLOX. Bien que tous deux soient réputés pour leurs performances élevées en matière de détection d'objets, ils adoptent des approches architecturales fondamentalement différentes.

Ce guide fournit une analyse technique approfondie de ces deux modèles, comparant leurs architectures, leurs indicateurs de performance, leurs méthodologies de formation et leurs scénarios de déploiement idéaux afin d'aider les développeurs et les chercheurs à choisir l'outil adapté à leurs projets d'IA visuelle.

Présentation des modèles et différences architecturales

Ultralytics YOLOv5

Présenté par Ultralytics, YOLOv5 est rapidement devenu une norme industrielle grâce à son équilibre exceptionnel entre performances, facilité d'utilisation et efficacité mémoire. Construit nativement sur le PyTorch , YOLOv5 une architecture basée sur des ancrages. Il s'appuie sur des formes de cadres prédéfinies pour prédire l'emplacement des objets, ce qui le rend très efficace pour les tâches standard de détection d'objets.

L'un des principaux atouts de YOLOv5 son écosystème bien entretenu. Il dispose d'une documentation complète, d'une Python incroyablement simple et d'une intégration native avec la Ultralytics . Cela permet aux développeurs de passer sans difficulté de l'étiquetage des ensembles de données à la formation et à l'exportation vers des formats tels que ONNX et TensorRT.

En savoir plus sur YOLOv5

Avantage de l'écosystème

YOLO Ultralytics nécessitent généralement beaucoup moins GPU pendant l'entraînement que les alternatives complexes basées sur des transformateurs. Cette faible empreinte mémoire rend YOLOv5 accessible aux chercheurs qui travaillent avec du matériel grand public.

Megvii YOLOX

Développé par les chercheurs de Megvii, YOLOX a emprunté une voie différente en introduisant une conception sans ancrage dans la YOLO . En éliminant les boîtes d'ancrage, YOLOX simplifie la tête de détection et réduit considérablement le nombre de paramètres heuristiques qui doivent être réglés manuellement pendant l'entraînement.

YOLOX intègre également une tête découplée, qui sépare les tâches de classification et de régression en différentes branches du réseau, et utilise la stratégie d'attribution d'étiquettes SimOTA. Ces innovations comblent le fossé entre la recherche universitaire et les applications industrielles, rendant YOLOX particulièrement efficace dans les environnements où les échelles des objets sont très variées.

En savoir plus sur YOLOX

Performance et indicateurs

Lors de l'évaluation des modèles de vision par ordinateur, le compromis entre la précision moyenne (mAP) et la vitesse d'inférence est essentiel. Les deux modèles offrent une gamme de tailles (de Nano à Extra-Large) pour s'adapter à différentes contraintes matérielles.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Alors que YOLOXx atteint une précision maximale légèrement supérieure (51,1 mAP), YOLOv5 un pipeline de déploiement beaucoup plus robuste et minutieusement testé sur GPU CPU GPU . Les TensorRT pour YOLOv5 son optimisation approfondie pour les appareils informatiques de pointe, ce qui en fait un choix très fiable pour l'analyse vidéo en temps réel.

Méthodologies de formation et convivialité

L'expérience développeur varie considérablement entre ces deux architectures.

L'approche YOLOX

La formation YOLOX nécessite généralement le clonage du référentiel d'origine, la gestion de dépendances spécifiques et l'exécution de scripts de ligne de commande complexes. Bien qu'il prenne en charge des fonctionnalités avancées telles que la formation à précision mixte et les configurations multi-nœuds via MegEngine, la courbe d'apprentissage peut être raide pour les développeurs qui ont besoin d'un prototypage rapide.

L'avantage Ultralytics

En revanche, Ultralytics une expérience utilisateur exceptionnellement simplifiée. Avec le ultralytics Grâce Python , les développeurs peuvent charger, entraîner et valider un modèle avec un minimum de code standard. Ultralytics gère Ultralytics les augmentations de données complexes, l'évolution des hyperparamètres et la planification des taux d'apprentissage.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

De plus, la polyvalence YOLOv5 va au-delà de la détection d'objets standard, offrant une prise en charge robuste pour la classification d'images et la segmentation d'instances au sein de la même API cohérente.

Déploiement Optimisé

Une fois votre formation terminée, l'exportation d'un YOLOv5 vers CoreML, TFLite ou OpenVINO aussi simple que d'exécuter model.export(format="onnx")Cela élimine le besoin de scripts de conversion tiers généralement requis par les référentiels axés sur la recherche.

Applications concrètes

Le choix entre ces modèles dépend de votre environnement de déploiement et de vos exigences techniques :

  • Gestion des ventes au détail et des stocks : pour les applications nécessitant une reconnaissance des produits en temps réel sur des appareils périphériques tels que NVIDIA , YOLOv5 est particulièrement bien adapté. Son empreinte mémoire minimale et ses vitesses TensorRT rapides permettent un suivi multi-caméras sans perte d'images.
  • Recherche universitaire et architectures personnalisées :YOLOX est très apprécié dans le milieu de la recherche. Sa tête découplée et son absence d'ancrage en font une excellente base de référence pour les ingénieurs qui souhaitent expérimenter de nouvelles stratégies d'attribution d'étiquettes ou ceux qui travaillent sur des ensembles de données où les boîtes d'ancrage traditionnelles ne parviennent pas à généraliser.
  • IA agricole : pour les tâches agricoles de précision telles que la détection des fruits ou l'identification des mauvaises herbes à l'aide de drones, la facilité de formation et de déploiement YOLOv5 à l'aide de la Ultralytics permet aux experts du domaine de mettre en œuvre des solutions d'IA sans avoir besoin de connaissances approfondies en ingénierie du machine learning.

Cas d'utilisation et recommandations

Le choix entre YOLOv5 YOLOX dépend des exigences spécifiques de votre projet, des contraintes de déploiement et de vos préférences en matière d'écosystème.

Quand choisir YOLOv5

YOLOv5 un excellent choix pour :

  • Systèmes de production éprouvés : déploiements existants où track longue track YOLOv5 en matière de stabilité, sa documentation exhaustive et le soutien massif de la communauté sont appréciés.
  • Formation avec ressources limitées : environnements avec GPU limitées où le pipeline de formation efficace et les faibles exigences en mémoire YOLOv5 sont avantageux.
  • Prise en charge étendue des formats d'exportation : projets nécessitant un déploiement dans de nombreux formats, notamment ONNX, TensorRT, CoreMLet TFLite.

Quand choisir YOLOX

YOLOX est recommandé pour :

  • Recherche sur la détection sans ancrage : recherche universitaire utilisant l'architecture propre et sans ancrage de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou fonctions de perte.
  • Dispositifs périphériques ultra-légers : déploiement sur des microcontrôleurs ou du matériel mobile existant où l'empreinte extrêmement réduite (0,91 M de paramètres) de la variante YOLOX-Nano est essentielle.
  • Études sur l'attribution des étiquettes SimOTA : projets de recherche visant à étudier les stratégies optimales d'attribution des étiquettes basées sur le transport et leur impact sur la convergence de l'apprentissage.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

L'avenir de l'IA visuelle : découvrez YOLO26

Si YOLOv5 YOLOX ont tous deux consolidé leur place dans l'histoire de la vision par ordinateur, ce domaine connaît une évolution rapide. Pour les développeurs qui se lancent aujourd'hui dans de nouveaux projets, Ultralytics recommande Ultralytics d'explorer son dernier modèle phare, YOLO26.

Sorti en janvier 2026, YOLO26 représente une avancée considérable en termes de performances et de convivialité. Il introduit une conception révolutionnaire NMS de bout en bout, éliminant complètement le post-traitement de suppression non maximale. Cela réduit considérablement la variabilité de la latence et simplifie la logique de déploiement sur les appareils à faible consommation d'énergie.

De plus, YOLO26 utilise le nouvel optimiseur MuSGD, un hybride de SGD Muon inspiré des innovations en matière de formation LLM, pour une convergence incroyablement stable et rapide. Grâce à la suppression du DFL (Distribution Focal Loss, supprimé pour simplifier l'exportation et améliorer la compatibilité avec les appareils de pointe/à faible consommation d'énergie), YOLO26 atteint CPU jusqu'à 43 % plus rapide, consolidant ainsi sa position de modèle ultime pour les applications modernes d'informatique de pointe, de robotique et d'IoT. De plus, ProgLoss + STAL offre des fonctions de perte améliorées avec des progrès notables dans la reconnaissance des petits objets, essentielle pour l'IoT, la robotique et l'imagerie aérienne. Les utilisateurs intéressés par les générations précédentes peuvent également se tourner vers YOLO11, bien que YOLO26 soit sans conteste le choix le plus avancé.

Conclusion

YOLOv5 YOLOX offrent tous deux d'incroyables capacités de détection d'objets. YOLOX a repoussé les limites architecturales en prouvant que les conceptions sans ancrage pouvaient rivaliser avec les méthodes traditionnelles et les surpasser en 2021. Cependant, YOLOv5 reste une force dominante en raison de sa facilité d'utilisation inégalée, de son écosystème étendu et de ses faibles besoins en mémoire pendant la formation.

Pour la grande majorité des applications commerciales, Ultralytics offre le chemin le plus rapide entre un ensemble de données brutes et un modèle de production déployé. Qu'ils utilisent le YOLOv5 éprouvé YOLOv5 qu'ils passent au YOLO26 de pointe, les développeurs bénéficient d'un cadre conçu pour rendre l'IA visuelle accessible, efficace et hautement performante.


Commentaires