Link to this sectionYOLOv5 vs YOLOX#
L'évolution de la vision par ordinateur en temps réel a connu de nombreuses étapes clés, avec différentes architectures repoussant les limites de la vitesse et de la précision. Deux modèles très influents dans ce domaine sont YOLOv5 et YOLOX. Bien que tous deux soient reconnus pour leurs hautes performances en détection d'objets, ils adoptent des approches architecturales fondamentalement différentes.
Ce guide fournit une analyse technique approfondie de ces deux modèles, en comparant leurs architectures, leurs mesures de performance, leurs méthodologies d'entraînement et leurs scénarios de déploiement idéaux pour aider les développeurs et les chercheurs à choisir l'outil adapté à leurs projets de vision par IA.
Link to this sectionPrésentation des modèles et différences architecturales#
Link to this sectionUltralytics YOLOv5#
- Auteur : Glenn Jocher
- Organisation : Ultralytics
- Date : 2020-06-26
- GitHub : Dépôt Ultralytics YOLOv5
- Documentation : Docs officielles YOLOv5
Présenté par Ultralytics, YOLOv5 est rapidement devenu une référence du secteur grâce à son équilibre exceptionnel entre performance, facilité d'utilisation et efficacité mémoire. Construit nativement sur le framework PyTorch, YOLOv5 utilise une architecture basée sur des ancres. Il s'appuie sur des formes de bounding box prédéfinies pour prédire l'emplacement des objets, ce qui le rend très efficace pour les tâches standards de détection d'objets.
L'un des plus grands atouts de YOLOv5 est son écosystème bien entretenu. Il bénéficie d'une documentation étendue, d'une API Python incroyablement simple et d'une intégration native avec la Plateforme Ultralytics. Cela permet aux développeurs de passer en toute transparence de l'étiquetage des jeux de données à l'entraînement et à l'exportation vers des formats comme ONNX et TensorRT.
Les modèles YOLO d'Ultralytics nécessitent généralement beaucoup moins de mémoire GPU lors de l'entraînement par rapport aux alternatives complexes basées sur les Transformer. Cette faible empreinte mémoire rend YOLOv5 très accessible aux chercheurs travaillant avec du matériel grand public.
Link to this sectionMegvii YOLOX#
- Auteurs : Zheng Ge, Songtao Liu, Feng Wang, Zeming Li et Jian Sun
- Organisation : Megvii
- Date : 18-07-2021
- Arxiv : YOLOX : Dépasser la série YOLO en 2021
- GitHub : Dépôt Megvii YOLOX
- Documentation : Docs GitHub YOLOX
Développé par des chercheurs chez Megvii, YOLOX a pris une voie différente en introduisant une conception sans ancres dans la famille YOLO. En éliminant les anchor boxes, YOLOX simplifie la tête de détection et réduit considérablement le nombre de paramètres heuristiques nécessitant un réglage manuel lors de l'entraînement.
YOLOX intègre également une tête découplée—séparant les tâches de classification et de régression en différentes branches de réseau—et utilise la stratégie d'assignation d'étiquettes SimOTA. Ces innovations comblent le fossé entre la recherche académique et les applications industrielles, rendant YOLOX particulièrement efficace dans des environnements avec des échelles d'objets très variées.
Link to this sectionPerformances et mesures#
Lors de l'évaluation des modèles de vision par ordinateur, le compromis entre la précision moyenne (mAP) et la vitesse d'inférence est critique. Les deux modèles offrent une gamme de tailles (de Nano à Extra-Large) pour s'adapter à différentes contraintes matérielles.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Bien que YOLOXx atteigne une précision de pointe légèrement supérieure (51.1 mAP), YOLOv5 offre un pipeline de déploiement beaucoup plus robuste et minutieusement testé sur CPU et GPU. Les vitesses TensorRT pour YOLOv5 soulignent son optimisation poussée pour les appareils d'informatique en périphérie (edge computing), ce qui en fait un choix très fiable pour l'analyse vidéo en temps réel.
Link to this sectionMéthodologies d'entraînement et utilisabilité#
L'expérience développeur varie considérablement entre ces deux architectures.
Link to this sectionL'approche YOLOX#
L'entraînement de YOLOX nécessite généralement de cloner le dépôt original, de gérer des dépendances spécifiques et d'exécuter des scripts de ligne de commande complexes. Bien qu'il prenne en charge des fonctionnalités avancées comme l'entraînement en précision mixte et les configurations multi-nœuds via MegEngine, la courbe d'apprentissage peut être abrupte pour les développeurs ayant besoin de prototypage rapide.
Link to this sectionL'avantage Ultralytics#
En revanche, Ultralytics privilégie une expérience utilisateur exceptionnellement simplifiée. Avec le paquet Python ultralytics, les développeurs peuvent charger, entraîner et valider un modèle avec un minimum de code répétitif. Ultralytics gère automatiquement les augmentations de données complexes, l'évolution des hyperparamètres et la planification du taux d'apprentissage.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()De plus, la polyvalence de YOLOv5 s'étend au-delà de la détection d'objets standard, offrant une prise en charge robuste de la classification d'images et de la segmentation d'instances au sein de la même API cohérente.
Une fois ton entraînement terminé, exporter un modèle YOLOv5 vers CoreML, TFLite ou OpenVINO est aussi simple qu'exécuter model.export(format="onnx"). Cela élimine le besoin de scripts de conversion tiers couramment requis par les dépôts axés sur la recherche.
Link to this sectionApplications concrètes#
Le choix entre ces modèles dépend de ton environnement de déploiement et de tes besoins techniques :
- Commerce de détail et gestion des stocks : Pour les applications nécessitant une reconnaissance de produits en temps réel sur des appareils en périphérie comme le NVIDIA Jetson, YOLOv5 est exceptionnellement bien adapté. Son empreinte mémoire minimale et ses vitesses d'inférence TensorRT rapides permettent le suivi multi-caméra sans perte d'images.
- Recherche académique et architectures personnalisées : YOLOX est très respecté dans la communauté de recherche. Sa tête découplée et sa nature sans ancres en font une excellente base pour les ingénieurs souhaitant expérimenter de nouvelles stratégies d'assignation d'étiquettes ou ceux travaillant sur des jeux de données où les anchor boxes traditionnelles ne parviennent pas à généraliser.
- IA agricole : Pour des tâches d'agriculture de précision comme la détection de fruits ou l'identification de mauvaises herbes via des drones, la facilité d'entraînement et de déploiement des modèles YOLOv5 à l'aide de la Plateforme Ultralytics permet aux experts du domaine de mettre en œuvre des solutions IA sans avoir besoin de solides bases en ingénierie d'apprentissage automatique.
Link to this sectionCas d'utilisation et recommandations#
Choisir entre YOLOv5 et YOLOX dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.
Link to this sectionQuand choisir YOLOv5#
YOLOv5 est un choix solide pour :
- Systèmes de production éprouvés : Déploiements existants où la longue expérience de stabilité de YOLOv5, sa documentation étendue et le soutien massif de la communauté sont valorisés.
- Entraînement aux ressources limitées : Environnements avec des ressources GPU limitées où le pipeline d'entraînement efficace et les exigences mémoire inférieures de YOLOv5 sont avantageux.
- Prise en charge étendue des formats d'exportation : Projets nécessitant un déploiement sur de nombreux formats, dont ONNX, TensorRT, CoreML et TFLite.
Link to this sectionQuand choisir YOLOX#
YOLOX est recommandé pour :
- Recherche sur la détection sans ancres : La recherche académique utilisant l'architecture propre et sans ancres de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou des fonctions de perte.
- Appareils en périphérie ultra-légers : Le déploiement sur des microcontrôleurs ou du matériel mobile ancien où l'empreinte extrêmement réduite de la variante YOLOX-Nano (0.91 M de paramètres) est critique.
- Études sur l'assignation de labels SimOTA : Les projets de recherche étudiant les stratégies d'assignation de labels basées sur le transport optimal et leur impact sur la convergence de l'entraînement.
Link to this sectionQuand choisir Ultralytics (YOLO26)#
Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :
- Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
- Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
- Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.
Link to this sectionL'avenir de la vision par IA : Voici YOLO26#
Bien que YOLOv5 et YOLOX aient tous deux marqué l'histoire de la vision par ordinateur, le domaine progresse rapidement. Pour les développeurs commençant de nouveaux projets aujourd'hui, Ultralytics recommande fortement d'explorer son tout dernier modèle phare, YOLO26.
Sorti en janvier 2026, YOLO26 représente un bond en avant massif en termes de performance et de facilité d'utilisation. Il introduit une conception révolutionnaire de bout en bout sans NMS, éliminant complètement le post-traitement par suppression non maximale. Cela réduit considérablement la variabilité de la latence et simplifie la logique de déploiement sur les appareils à faible puissance.
En outre, YOLO26 utilise le nouvel optimiseur MuSGD—un hybride de SGD et Muon inspiré par les innovations en entraînement LLM—pour une convergence incroyablement stable et rapide. Avec la suppression DFL (Distribution Focal Loss supprimée pour une exportation simplifiée et une meilleure compatibilité avec les appareils en périphérie/faible puissance), YOLO26 atteint jusqu'à 43 % d'inférence CPU plus rapide, consolidant sa position en tant que modèle ultime pour l'informatique moderne en périphérie, la robotique et les applications IoT. De plus, ProgLoss + STAL offre des fonctions de perte améliorées avec des avancées notables dans la reconnaissance des petits objets, critique pour l'IoT, la robotique et l'imagerie aérienne. Les utilisateurs intéressés par les générations précédentes peuvent également examiner YOLO11, bien que YOLO26 soit le choix incontesté de l'état de l'art.
Link to this sectionConclusion#
YOLOv5 et YOLOX offrent tous deux d'incroyables capacités de détection d'objets. YOLOX a repoussé les limites architecturales en prouvant que les conceptions sans ancres pouvaient rivaliser avec les méthodes traditionnelles et les surpasser en 2021. Cependant, YOLOv5 reste une force dominante grâce à sa facilité d'utilisation inégalée, son vaste écosystème et ses exigences de mémoire réduites lors de l'entraînement.
Pour la grande majorité des applications commerciales, l'écosystème Ultralytics offre le chemin le plus rapide d'un jeu de données brut à un modèle de production déployé. Qu'il s'agisse d'utiliser le fiable YOLOv5 ou de passer au YOLO26 de pointe, les développeurs bénéficient d'un framework conçu pour rendre la vision par IA accessible, efficace et hautement performante.