Passer au contenu

YOLOv5 YOLO11: faire le pont entre héritage et innovation dans la détection d'objets

L'évolution de l'architecture YOLO You Only Look Once) a marqué une étape décisive dans le domaine de la vision par ordinateur. De la fiabilité fondamentale de YOLOv5 l'efficacité avancée de YOLO11, chaque itération a repoussé les limites de la vitesse et de la précision. Ce guide fournit une comparaison technique détaillée afin d'aider les développeurs, les chercheurs et les ingénieurs à choisir le modèle adapté à leurs besoins spécifiques en matière de déploiement.

Aperçu du modèle

YOLOv5: la norme industrielle

Publié en 2020 par Glenn Jocher et Ultralytics, YOLOv5 est rapidement devenu la référence en matière de détection d'objets pratique. Il s'agit du premier YOLO implémenté nativement dans PyTorch, ce qui le rendait exceptionnellement accessible à l'ensemble de la communauté IA. Son équilibre entre facilité d'utilisation, pipelines de formation robustes et flexibilité de déploiement lui a permis de s'imposer dans des milliers d'applications académiques et industrielles.

En savoir plus sur YOLOv5

YOLO11: le successeur raffiné

YOLO11, lancé en 2024, représente une avancée significative dans la Ultralytics . S'appuyant sur les progrès architecturaux de YOLOv8, il introduit une structure backbone et head raffinée, conçue pour une extraction des caractéristiques et une efficacité supérieures. YOLO11 sur l'optimisation du rapport précision/calcul, offrant une précision moyenne (mAP) plus élevée avec moins de paramètres que ses prédécesseurs.

En savoir plus sur YOLO11

Dernière recommandation

Bien que YOLO11 des améliorations significatives par rapport à YOLOv5, les développeurs qui lancent de nouveaux projets en 2026 devraient également évaluer YOLO26. Il se caractérise par une conception native de bout en bout (suppression NMS), un optimiseur MuSGD innovant et CPU jusqu'à 43 % plus rapide, ce qui en fait le choix idéal pour les déploiements de pointe modernes.

Comparaison des architectures techniques

Backbone et extraction de caractéristiques

YOLOv5 utilise une structure CSPDarknet. Cette conception de réseau partiel inter-étapes a été révolutionnaire pour réduire la redondance computationnelle tout en conservant un flux de gradient riche. Elle équilibre efficacement la profondeur et la largeur, permettant au modèle d'apprendre des caractéristiques complexes sans faire exploser le nombre de paramètres.

YOLO11 fait évoluer ce concept avec une dorsale CSP améliorée (C3k2) et introduit des mécanismes d'attention spatiale améliorés. L'architecture est spécialement conçue pour capturer les détails les plus fins, ce qui améliore considérablement les performances en matière de détection de petits objets. Cette conception raffinée permet YOLO11 atteindre une plus grande précision avec un modèle plus compact.

Tête de détection

La tête de détection dans YOLOv5 est basée sur des ancres, s'appuyant sur des boîtes d'ancrage prédéfinies pour prédire l'emplacement des objets. Bien qu'efficace, cette approche nécessite un réglage minutieux des hyperparamètres des dimensions des ancres pour les ensembles de données personnalisés.

YOLO11 adopte une tête de détection sans ancrage. Cette approche moderne simplifie le processus d'entraînement en prédisant directement les centres et les dimensions des objets, éliminant ainsi le besoin de calculs d'ancrage. Cela permet non seulement de rationaliser le pipeline d'entraînement, mais aussi d'améliorer la généralisation pour diverses formes et proportions d'objets.

Mesures de performance

Le tableau suivant met en évidence les différences de performances entre YOLOv5 YOLO11. Une observation clé est le compromis entre vitesse et précision. YOLO11 obtient YOLO11 mAP plus élevés tout en conservant des vitesses d'inférence compétitives ou supérieures, en particulier sur GPU .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n64028.073.61.121.94.5
YOLOv5s64037.4120.71.927.216.5
YOLOv5m64045.4233.94.0321.249.0
YOLOv5l64049.0408.46.6146.5109.1
YOLOv5x64050.7763.211.8986.7205.7
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analyse :

  • Précision : YOLO11n (Nano) atteint un impressionnant mAP de 39,5 %, surpassant largement les 28,0 % de YOLOv5n. Cela fait YOLO11 choix bien supérieur pour les applications légères nécessitant une grande précision.
  • Vitesse : YOLO11 affichent des vitesses CPU plus rapides dans ONNX , ce qui est crucial pour le déploiement surGPU .
  • Efficacité : YOLO11 ces gains avec un nombre de paramètres comparable ou souvent inférieur (par exemple, YOLO11x par rapport à YOLOv5x), ce qui démontre l'efficacité de ses optimisations architecturales.

Formation et écosystème

Facilité d'utilisation

Les deux modèles bénéficient du célèbre Ultralytics , qui privilégie l'expérience des développeurs.

  • YOLOv5 a établi la norme « commencez l'entraînement en 5 minutes » grâce à sa structure intuitive et à son utilisation du framework standard PyTorch .
  • YOLO11 s'intègre parfaitement dans l'environnement unifié ultralytics Python . Ce package fournit une API cohérente pour toutes les tâches, ce qui signifie que passer de Détection à Segmentation d'instance ou Estimation de pose ne nécessite de modifier qu'un seul argument de chaîne.

Efficacité de l'entraînement

YOLO11 des routines d'entraînement optimisées qui conduisent souvent à une convergence plus rapide. Des fonctionnalités telles que l'augmentation mosaïque ont été affinées, et la conception sans ancrage supprime l'étape de prétraitement de l'évolution automatique des ancrages présente dans YOLOv5. De plus, les deux modèles affichent une utilisation de mémoire nettement inférieure pendant l'entraînement par rapport aux détecteurs basés sur des transformateurs tels que RT-DETR, ce qui permet d'utiliser des lots plus importants sur les GPU grand public.

Formation à l'Ultralytics

La formation YOLO11 incroyablement simple à l'aide du Python . La même syntaxe s'applique à YOLOv5 le ultralytics package.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Polyvalence

Alors que YOLOv5 la prise en charge de la segmentation et de la classification plus tard dans son cycle de vie, YOLO11 conçu dès le départ comme un système d'apprentissage multitâche. Il prend en charge nativement :

  • Détection d'objets
  • Segmentation d'instance
  • Classification d'images
  • Estimation de pose
  • Boîte englobante orientée (Oriented Bounding Box, OBB)

Cela fait de YOLO11 « couteau suisse » plus polyvalent pour les pipelines de vision par ordinateur complexes où plusieurs types d'analyse sont nécessaires simultanément.

Cas d'utilisation idéaux

Quand choisir YOLOv5

  • Systèmes hérités : Si vous disposez déjà d'un pipeline de production basé sur le format YOLOv5 spécifique YOLOv5 ou requirements.txt, continuer avec YOLOv5 la stabilité.
  • Contraintes matérielles spécifiques : sur du matériel extrêmement ancien ou certaines implémentations FPGA spécifiques, l'architecture plus simple de YOLOv5 disposer de flux binaires optimisés existants.
  • Reproduction de la recherche : pour reproduire les articles universitaires de 2020 à 2023 qui ont utilisé YOLOv5 référence.

Quand choisir YOLO11

  • Déploiement de l'IA en périphérie : grâce à son excellent rapport vitesse/précision, YOLO11 est YOLO11 pour les appareils tels que NVIDIA ou Raspberry Pi, en particulier pour le traitement vidéo en temps réel.
  • Exigences de haute précision : applications dans l'imagerie médicale ou la détection de défauts où chaque point de pourcentage de mAP .
  • Applications multitâches : les projets nécessitant une estimation de la pose (par exemple, l'analyse sportive) ou des cadres de sélection pivotés (par exemple, la cartographie aérienne) bénéficient de la prise en charge native YOLO11.
  • Formation sur le cloud : utilisation de la Ultralytics pour une gestion rationalisée des ensembles de données et la formation des modèles.

Conclusion

YOLOv5 YOLO11 tous deux de l'engagement Ultralytics en faveur de l'excellence open source. YOLOv5 reste un outil fiable et éprouvé. Cependant, YOLO11 offre une mise à niveau convaincante grâce à ses améliorations architecturales, sa précision supérieure et sa prise en charge plus large des tâches.

Pour les développeurs tournés vers l'avenir, le choix est clair : YOLO11 les performances nécessaires aux applications modernes. Pour ceux qui recherchent le nec plus ultra, nous recommandons également vivement d'explorer YOLO26, qui introduit une détection de bout en bout NMS pour un déploiement encore plus simple.

Explorer la documentation YOLO26

D'autres modèles pourraient également vous intéresser, notamment YOLOv10 pour la recherche sur les performances en temps réel ou YOLO pour la détection à vocabulaire ouvert.


Commentaires