Passer au contenu

YOLOv7 YOLOv5: équilibre entre précision haut de gamme et polyvalence de production

Le choix de la bonne architecture de détection d'objets implique souvent de trouver un compromis entre les performances académiques brutes et la facilité de déploiement pratique. Cette comparaison détaillée explore deux étapes importantes dans la YOLO : YOLOv7, connu pour ses optimisations architecturales « bag-of-freebies », et YOLOv5, le Ultralytics légendaire célébré pour sa facilité d'utilisation, sa rapidité et son adoption massive dans les environnements de production.

Résumé

Alors que YOLOv7 atteint une précision maximale (mAP) plus élevée sur le COCO grâce à des choix architecturaux complexes tels que E-ELAN, YOLOv5 reste la norme industrielle en matière de convivialité, offrant une expérience de formation plus rationalisée, une consommation de ressources moindre et une prise en charge de déploiement plus large. Pour les développeurs qui lancent de nouveaux projets en 2026, la discussion a naturellement évolué vers Ultralytics , qui combine les avantages de la v7 en termes de précision avec la convivialité de la v5, ainsi qu'une inférence native de bout en bout NMS.

Comparaison des métriques de performance

Le tableau suivant met en évidence les différences de performances entre les principales variantes. YOLOv7 GPU haut de gamme, tandis que YOLOv5 une gamme granulaire de modèles adaptés à tout, des appareils mobiles aux serveurs cloud.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7: la puissance architecturale

Publié en juillet 2022 par les auteurs de YOLOv4, YOLOv7 a introduit plusieurs concepts avancés visant à repousser les limites de la précision de la détection d'objets en temps réel.

En savoir plus sur YOLOv7

Principales caractéristiques architecturales

  1. E-ELAN (Extended Efficient Layer Aggregation Network) : cette structure permet au réseau d'apprendre des caractéristiques plus diverses en contrôlant les chemins de gradient les plus courts et les plus longs. Elle améliore la capacité d'apprentissage du réseau sans détruire le chemin de gradient d'origine, ce qui se traduit par une plus grande précision dans les scènes complexes.
  2. Mise à l'échelle du modèle : contrairement à la mise à l'échelle composite standard, YOLOv7 simultanément la profondeur et la largeur du bloc, garantissant ainsi une architecture optimale pour différentes contraintes de ressources (par exemple, YOLOv7 vs YOLOv7).
  3. Trainable Bag-of-Freebies : le modèle intègre des techniques de reparamétrisation planifiées qui optimisent la structure du modèle pendant l'entraînement, mais la simplifient pendant l'inférence, ce qui permet d'augmenter efficacement la vitesse sans perte de précision.

Cas d'utilisation idéaux pour YOLOv7

YOLOv7 dans la recherche universitaire et les applications industrielles haut de gamme où chaque point de pourcentage de mAP , comme les systèmes de sécurité pour la conduite autonome ou la détection de petits défauts dans les images de fabrication haute résolution.

YOLOv5 : la norme de production

YOLOv5, développé par Ultralytics, a révolutionné le domaine non seulement grâce à son architecture, mais aussi en donnant la priorité à l'expérience des développeurs. Il s'agit du premier YOLO implémenté nativement dans PyTorch, ce qui le rend accessible à une vaste communauté de Python .

En savoir plus sur YOLOv5

Pourquoi les développeurs choisissent YOLOv5

  • Une polyvalence inégalée : alors que YOLOv7 principalement sur la détection, YOLOv5 la segmentation d'instances et la classification d'images dès son installation.
  • Faible empreinte mémoire : YOLOv5 très efficace avec CUDA , ce qui permet des lots plus importants sur le matériel grand public par rapport aux modèles basés sur des transformateurs ou aux architectures plus lourdes.
  • Écosystème de déploiement : il offre une exportation transparente vers ONNX, CoreML, TFLite et TensorRT, ce qui en fait le choix idéal pour les applications mobiles et les appareils périphériques tels que NVIDIA .

L'avantage Ultralytics : écosystème et convivialité

Lorsque l'on compare ces modèles, l'écosystème environnant est souvent aussi important que l'architecture elle-même. Ultralytics (YOLOv5 le plus récent YOLO26) bénéficient d'une plateforme unifiée et bien entretenue.

Facilité d'utilisation et efficacité de la formation

La formation d'un modèle ne devrait pas nécessiter un doctorat en informatique. Ultralytics une Python simple qui standardise le flux de travail. Vous pouvez passer de la formation d'un YOLOv5 à un modèle YOLO11 ou YOLO26 en modifiant un seul argument de chaîne.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

La plateforme intégrée

Les utilisateurs des Ultralytics ont accès à la Ultralytics , un hub web dédié à la gestion des ensembles de données, à l'annotation automatisée et au déploiement de modèles en un clic. Cette intégration dans un écosystème réduit considérablement le délai de mise sur le marché des produits de vision par ordinateur par rapport à la gestion de référentiels bruts.

Préparer l'avenir avec YOLO26

Si YOLOv7 YOLOv5 performants, le domaine de la vision par ordinateur évolue rapidement. Pour les nouveaux projets, Ultralytics offre des avantages significatifs par rapport à ses deux prédécesseurs.

Sorti en janvier 2026, YOLO26 remédie aux limitations spécifiques des générations précédentes :

  • NMS de bout en bout : contrairement à YOLOv5 v7, qui nécessitent un post-traitement par suppression non maximale (NMS), YOLO26 est nativement de bout en bout. Il en résulte un code plus propre et une inférence plus rapide, en particulier sur les appareils périphériques où NMS un goulot d'étranglement.
  • Optimiseur MuSGD : inspiré de la stabilité de l'entraînement LLM, ce nouvel optimiseur garantit une convergence plus rapide que le SGD standard SGD dans les versions 5 et 7.
  • Optimisation des bords : en supprimant la perte focale de distribution (DFL), YOLO26 est jusqu'à 43 % plus rapide sur CPU, ce qui le rend supérieur pour les déploiements mobiles.
  • Détection améliorée des petits objets : grâce à ProgLoss et STAL (auto-apprentissage avec apprentissage par ancrage), il surpasse YOLOv7 les petits objets, un facteur critique pour les tâches d'imagerie aérienne et par drone.

En savoir plus sur YOLO26

Conclusion

YOLOv7 est une réalisation architecturale puissante, offrant une grande précision aux chercheurs et GPU spécifiques hautement performants. Cependant, l'accent mis sur la complexité du « bag-of-freebies » peut rendre sa modification et son déploiement plus difficiles que Ultralytics .

YOLOv5 reste une référence dans le secteur pour son équilibre entre performances, facilité d'utilisation et incroyable polyvalence dans des tâches telles que la détection, la segmentation et la classification. Il s'agit d'un choix sûr et fiable pour de nombreux systèmes de production existants.

Pour ceux qui recherchent le meilleur des deux mondes, à savoir une grande précision et une facilité d'utilisation, nous recommandons YOLO26. Il combine Ultralytics convivial Ultralytics avec des innovations de pointe telles que l'inférence NMS et l'optimisation MuSGD, garantissant ainsi la rapidité, la précision et la pérennité de vos applications.

Lectures complémentaires


Commentaires