Link to this sectionYOLOv5 vs YOLOv7#
Le paysage de la vision par ordinateur a évolué rapidement au cours des dernières années, porté par le besoin d'une détection d'objets en temps réel plus rapide et plus précise. Au moment de choisir l'architecture adaptée à ton projet de vision par ordinateur, il est crucial de comprendre les nuances entre des modèles populaires comme Ultralytics YOLOv5 et YOLOv7. Cette comparaison technique complète analyse leurs architectures, méthodologies d'entraînement, mesures de performance et scénarios de déploiement idéaux pour t'aider à prendre une décision éclairée.
Link to this sectionEn un coup d'œil : Origines des modèles#
Comprendre les origines et les philosophies de conception derrière ces modèles apporte un contexte sur leurs choix architecturaux.
Détails de YOLOv5 :
- Auteurs : Glenn Jocher
- Organisation : Ultralytics
- Date : 2020-06-26
- GitHub : Dépôt YOLOv5
- Docs : Documentation YOLOv5
Détails sur YOLOv7 :
- Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
- Organisation : Institute of Information Science, Academia Sinica, Taiwan
- Date : 2022-07-06
- Arxiv : Article sur YOLOv7
- GitHub : Dépôt YOLOv7
- Docs : Documentation YOLOv7
Curieux de savoir comment ces modèles se comparent aux autres ? Consulte nos comparatifs comme YOLOv5 vs YOLO11 ou YOLOv7 vs EfficientDet pour approfondir ta compréhension de l'écosystème de la détection d'objets.
Link to this sectionInnovations architecturales et différences#
Link to this sectionYOLOv5 : La référence en matière d'accessibilité#
Introduit par Ultralytics en 2020, YOLOv5 a provoqué un changement de paradigme en utilisant nativement le framework PyTorch, abaissant considérablement la barrière à l'entrée pour les chercheurs et les développeurs. Son architecture repose sur une dorsale Modified CSPDarknet53, intégrant des réseaux Cross Stage Partial (CSP) pour réduire le nombre de paramètres tout en préservant le flux de gradient.
L'une de ses plus grandes forces réside dans ses besoins en mémoire. Par rapport aux anciens détecteurs à deux étapes ou aux modèles de Transformer lourds comme RT-DETR, YOLOv5 nécessite beaucoup moins de mémoire CUDA pendant l'entraînement, ce qui permet d'utiliser des tailles de batch plus grandes sur des GPU grand public standard. De plus, sa polyvalence native prend en charge de manière transparente la classification d'images, la détection d'objets et la segmentation d'images.
Link to this sectionYOLOv7 : Repousser les limites de la précision en temps réel#
Sorti mi-2022, YOLOv7 s'est concentré sur le dépassement des limites de l'état de l'art pour la détection en temps réel sur les benchmarks MS COCO. Les auteurs ont introduit l'Extended Efficient Layer Aggregation Network (E-ELAN), qui améliore la capacité d'apprentissage du réseau sans détruire le chemin de gradient original.
YOLOv7 est également célèbre pour son "sac à astuces entraînables" (trainable bag-of-freebies), notamment ses techniques de re-paramétrage pendant l'entraînement qui convertissent plusieurs modules en une seule couche convolutive pour l'inférence, augmentant ainsi la vitesse sans sacrifier la précision. Cependant, cette méthodologie d'entraînement complexe entraîne souvent des courbes d'apprentissage plus raides et des pipelines d'exportation moins directs par rapport à l'écosystème natif Ultralytics.
Link to this sectionComparaison des performances#
Lors de l'évaluation de ces modèles, l'équilibre des performances entre vitesse, précision et coût computationnel est primordial. Voici une comparaison détaillée de leurs mesures de performance basées sur le jeu de données MS COCO val2017.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Bien que YOLOv7 atteigne des scores mAP absolus plus élevés sur les variantes plus grandes, YOLOv5 offre un spectre de modèles inégalé, allant du Nano ultra-léger (YOLOv5n) pour les appareils en périphérie extrême au Extra-Large (YOLOv5x) pour l'inférence dans le cloud.
Link to this sectionL'avantage de l'écosystème Ultralytics#
L'utilité d'un modèle dépasse sa simple architecture ; l'écosystème qui l'entoure dicte la rapidité avec laquelle il peut être déployé en production. C'est là que les modèles Ultralytics brillent.
- Facilité d'utilisation : La plateforme Ultralytics et son API Python unifiée offrent une expérience utilisateur simplifiée, une syntaxe claire et une documentation étendue. L'entraînement sur un jeu de données personnalisé ne nécessite aucun code répétitif.
- Écosystème bien entretenu : Ultralytics bénéficie d'un développement actif, de mises à jour fréquentes et d'un fort soutien de la communauté. Les intégrations avec des outils comme Comet ML et Weights & Biases sont nativement intégrées.
- Efficacité de l'entraînement : Les chargeurs de données, la mise en cache intelligente et la prise en charge multi-GPU rendent les modèles Ultralytics exceptionnellement efficaces à entraîner. Les poids pré-entraînés disponibles accélèrent considérablement le transfer learning.
Link to this sectionExemple de code : Pour commencer#
Avec Ultralytics, le déploiement d'un modèle ne nécessite que quelques lignes de code. L'extrait Python suivant démontre à quel point il est simple de charger, entraîner et exécuter une inférence en utilisant le package recommandé ultralytics.
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()En revanche, l'utilisation du dépôt original YOLOv7 implique généralement le clonage de dépôts complexes, la gestion manuelle des dépendances et l'utilisation de longs arguments en ligne de commande.
Link to this sectionApplications réelles et cas d'utilisation idéaux#
Link to this sectionQuand choisir YOLOv7#
YOLOv7 reste un candidat solide pour l'analyse comparative académique ou pour des pipelines GPU hérités spécifiques où le mAP maximal est le seul objectif et où le système est déjà adapté à ses tenseurs de sortie basés sur des ancres. Les chercheurs explorant l'analyse du chemin de gradient utilisent souvent YOLOv7 comme référence.
Link to this sectionQuand choisir YOLOv5#
YOLOv5 est fortement privilégié pour les environnements de production en raison de sa stabilité exceptionnelle. C'est le choix idéal pour :
- Informatique mobile et en périphérie (Edge) : Déployer YOLOv5n sur iOS via CoreML ou sur Android via TFLite.
- Startups agiles : Les équipes ayant besoin de cycles d'itération rapides bénéficient de l'intégration transparente de la plateforme Ultralytics pour la gestion des jeux de données et l'entraînement dans le cloud.
- Environnements multi-tâches : Systèmes nécessitant simultanément la détection, la classification et la segmentation d'objets.
Link to this sectionL'avenir : Passer à YOLO26#
Bien que comparer YOLOv5 et YOLOv7 soit un excellent exercice pour comprendre l'évolution de l'IA visuelle, l'état de l'art a continué de progresser. Sorti en janvier 2026, Ultralytics YOLO26 représente un saut monumental, rendant les architectures plus anciennes largement obsolètes pour les nouveaux projets.
Pour les développeurs recherchant le sommet de la performance, YOLO26 offre plusieurs avantages révolutionnaires par rapport à YOLOv5 et YOLOv7 :
- Conception de bout en bout sans NMS : En éliminant le post-traitement Non-Maximum Suppression, YOLO26 offre un déploiement nettement plus simple et une latence rapide et cohérente.
- Optimiseur MuSGD : Inspiré par les innovations LLM de Moonshot AI, cet optimiseur hybride offre un entraînement très stable et une convergence rapide.
- Vitesse en périphérie sans précédent : Spécifiquement optimisée pour les environnements en périphérie, la variante nano offre jusqu'à 43% d'inférence CPU plus rapide en supprimant la Distribution Focal Loss (DFL).
- Précision supérieure : De nouvelles fonctions de perte comme ProgLoss + STAL améliorent considérablement la reconnaissance des petits objets, ce qui le rend idéal pour les séquences de drones et la robotique.
Que tu maintiennes un pipeline YOLOv5 existant ou que tu cherches à mettre en œuvre le YOLO26 à la pointe de la technologie, la plateforme Ultralytics fournit tous les outils nécessaires pour réussir dans la vision par ordinateur moderne.