Passer au contenu

YOLO11 vs YOLOv5: évolution de la détection d'objets à la pointe de la technologie

L'évolution de la détection d'objets en temps réel a été marquée par la sérieYOLO d'Ultralytics . YOLOv5sorti en 2020, a établi une norme mondiale en matière de facilité d'utilisation, de rapidité et de fiabilité, devenant l'un des modèles d'IA de vision les plus déployés de l'histoire. YOLO11la dernière itération, s'appuie sur cette base légendaire pour offrir une précision, une efficacité et une polyvalence sans précédent.

Ce guide fournit une comparaison technique détaillée entre ces deux centrales, aidant les développeurs et les chercheurs à comprendre les changements architecturaux, les gains de performance et les cas d'utilisation idéaux pour chacune d'entre elles.

Analyse des performances

L'écart de performance entre YOLO11 et YOLOv5 met en évidence les progrès rapides réalisés dans la conception des réseaux neuronaux. Si YOLOv5 reste un modèle performant, YOLO11 le surpasse systématiquement à toutes les échelles de modèle, notamment en termes de vitesse d'inférence du CPU et de précision de détection.

Principaux indicateurs de performance

Le tableau ci-dessous présente une comparaison directe sur l'ensemble de donnéesCOCO . Une observation critique est l'efficacité de YOLO11n, qui atteint 39,5 mAP, dépassant de manière significative les 28,0 mAP de YOLOv5n, tout en fonctionnant plus rapidement sur le matériel de l'CPU .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Précision et efficacité

YOLO11 représente un changement de paradigme dans le compromis "efficacité/précision".

  • Détection des petits objets : YOLO11 améliore considérablement la détection des petits objets par rapport à YOLOv5, grâce à ses couches d'extraction de caractéristiques affinées.
  • Efficacité de calcul : YOLO11l atteint 53,4 mAP avec seulement 25,3 millions de paramètres. En revanche, YOLOv5l nécessite 53,2 millions de paramètres pour atteindre un mAP inférieur de 49,0. Cette réduction de 50 % des paramètres pour une plus grande précision se traduit par une utilisation moindre de la mémoire et des temps de formation plus rapides.

Sans ancrage ou avec ancrage

L'une des différences techniques les plus significatives est le mécanisme de la tête de détection. YOLOv5 utilise une approche basée sur l'ancrage, qui nécessite des boîtes d'ancrage prédéfinies qui doivent être ajustées pour des ensembles de données spécifiques afin d'obtenir des performances optimales.

YOLO11 utilise une conception sans ancrage. Cela élimine le besoin de calculer manuellement la boîte d'ancrage, simplifie le pipeline de formation et améliore la généralisation sur divers ensembles de données sans réglage de l'hyperparamètre.

Architecture et conception du modèle

Les différences architecturales entre ces deux modèles reflètent la progression de la recherche en matière de vision par ordinateur sur plusieurs années.

YOLOv5: la norme éprouvée

YOLOv5 a introduit une implémentation conviviale de PyTorch qui a rendu la détection d'objets accessible au plus grand nombre.

  • Réseau de base : Utilise un CSPDarknet53 modifié, qui est très efficace mais plus lourd à calculer que les alternatives modernes.
  • Focus : Priorité à un équilibre entre vitesse et précision qui était révolutionnaire lors de sa sortie en 2020.
  • Héritage : il reste un "choix sûr" pour les systèmes déjà profondément intégrés avec ses formats d'entrée/sortie spécifiques.

En savoir plus sur YOLOv5

YOLO11: à la pointe de la technologie

YOLO11 intègre les dernières techniques d'apprentissage profond pour maximiser la réutilisation des caractéristiques et minimiser la charge de calcul.

  • Bloc C3k2 : Une évolution du goulot d'étranglement CSP, ce bloc permet un flux de gradient et une fusion des caractéristiques plus efficaces.
  • Module C2PSA : Introduit les mécanismes d'attention spatiale, permettant au modèle de se concentrer sur les zones critiques de l'image pour une meilleure localisation de l'objet.
  • Tête multi-tâches : Contrairement à YOLOv5, qui nécessite des modèles distincts pour les différentes tâches, YOLO11 supporte nativement la détection d'objets, la segmentation d'instances, l'estimation de la pose, les boîtes de délimitation orientées (OBB) et la classification dans un cadre unifié.

En savoir plus sur YOLO11

Tableau de comparaison : Spécifications techniques

FonctionnalitéYOLOv5YOLO11
ArchitectureCSPDarknet BackboneUne colonne vertébrale affinée avec C3k2 et C2PSA
Tête de détectionBasé sur l'ancrageSans ancrage
TâchesDétecter, segmenter, classerDétecter, segmenter, classer, poser, OBB, suivre
LicenceAGPL-3.0AGPL-3.0
Date de sortieJuin 2020septembre 2024
Facilité d'utilisationHaut (Ligne de commande & PyTorch Hub)Très élevé (Unified Python SDK & CLI)

Formation et écosystème

Les deux modèles bénéficient de l'écosystème robuste d'Ultralytics , qui fournit des outils transparents pour la gestion des données, la formation et le déploiement.

Efficacité de la formation

YOLO11 est conçu pour s'entraîner plus rapidement et converger plus vite que YOLOv5.

  • Défauts intelligents : Le moteur Ultralytics configure automatiquement les hyperparamètres en fonction de la taille de l'ensemble de données et du modèle, réduisant ainsi la nécessité d'un réglage manuel des hyperparamètres.
  • Utilisation de la mémoire : Grâce au nombre réduit de paramètres, les modèles YOLO11 consomment généralement moins de VRAM du GPU pendant l'apprentissage, ce qui permet d'augmenter la taille des lots sur le matériel grand public.

Exemple de code : Formation YOLO11

La formation de YOLO11 est simplifiée grâce à l'utilisation de l'application ultralytics Python . L'exemple suivant montre comment entraîner un modèle YOLO11n sur le jeu de données COCO8 .

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

Intégration de l'écosystème

Alors que YOLOv5 dispose d'une vaste collection de tutoriels tiers en raison de son ancienneté, YOLO11 est nativement intégré dans le package moderne Ultralytics . Cela permet un accès immédiat aux fonctionnalités avancées :

  • Exportation en un clic : Exporter vers ONNX, OpenVINOTensorRT et CoreML en une seule commande.
  • Suivi : Prise en charge intégrée du suivi des objets (BoT-SORT, ByteTrack) sans référentiels externes.
  • Explorer : Utilisez l'API Ultralytics Explorer pour visualiser et interroger vos ensembles de données à l'aide de SQL et de la recherche sémantique.

Cas d'utilisation idéaux

Le choix du bon modèle dépend des contraintes et des exigences spécifiques de votre projet.

Quand choisir YOLO11

YOLO11 est le choix recommandé pour 95% des nouveaux projets.

  1. Nouveaux développements : Si vous partez de zéro, YOLO11 offre la meilleure protection contre l'avenir, la plus grande précision et la plus grande rapidité.
  2. Déploiement surCPU : Pour les appareils périphériques fonctionnant sur CPU (par exemple, Raspberry Pi, téléphones mobiles), YOLO11n est significativement plus rapide et plus précis que YOLOv5n.
  3. Tâches complexes : Les projets nécessitant une estimation de la pose ou un OBB (par exemple, l'imagerie aérienne, l'analyse de documents) sont pris en charge par YOLO11.
  4. Cloud et serveur : Le débit élevé de YOLO11 en fait un outil idéal pour le traitement de flux vidéo massifs en temps réel.

Quand s'en tenir à YOLOv5

YOLOv5 reste une option viable pour des scénarios spécifiques.

  1. Maintenance de l'héritage : Si vous avez un système de production fortement couplé à la base de code spécifique de YOLOv5 ou au format de sortie.
  2. Mise au point matérielle spécifique : Certains accélérateurs embarqués plus anciens peuvent disposer d'un micrologiciel hautement optimisé, spécifiquement validé pour les couches YOLOv5 (bien que la plupart des moteurs d'exécution modernes comme OpenVINO favorisent désormais les architectures plus récentes).
  3. Base académique : Les chercheurs qui effectuent des comparaisons avec des références historiques citent souvent YOLOv5 en raison de sa présence de longue date dans la littérature.

Migration vers YOLO11

La migration de YOLOv5 vers YOLO11 est simple. Le format du jeu de donnéesYOLO TXT) reste identique, ce qui signifie que vous pouvez réutiliser vos jeux de données annotés existants sans modification. La structure de l'API Python est également très similaire, ne nécessitant souvent qu'un changement dans la chaîne de nom du modèle (par exemple, de yolov5su.pt à yolo11n.pt au sein de la ultralytics ).

Explorer d'autres options

Ultralytics prend en charge un large éventail de modèles au-delà de YOLO11 et YOLOv5. En fonction de vos besoins spécifiques, vous pouvez envisager :

  • YOLOv8: le prédécesseur direct de YOLO11, offrant un équilibre parfait entre les fonctionnalités et une large adoption par l'industrie.
  • YOLOv10: une architecture axée sur la formation NMS pour une latence réduite dans des applications spécifiques en temps réel.
  • RT-DETR: Un détecteur basé sur un transformateur qui excelle en précision dans les cas où la vitesse d'inférence est moins critique que la précision maximale.
  • YOLOv9: Connu pour son concept d'information à gradient programmable (PGI), il offre d'excellentes performances dans les tâches de détection difficiles.

Conclusion

Le passage de YOLOv5 à YOLO11 marque une étape importante dans l'histoire de la vision par ordinateur. YOLOv5 a démocratisé l'IA en rendant la détection d'objets accessible à tous. YOLO11 perfectionne cette vision en proposant un modèle plus rapide, plus léger et plus précis.

Pour les développeurs qui recherchent les meilleures performances par watt et les fonctionnalités les plus polyvalentes, YOLO11 est le gagnant incontestable. Son intégration dans l'écosystème actif d'Ultralytics vous garantit l'accès aux derniers outils, à des API simples et à une communauté florissante pour vous aider dans votre démarche d'IA.

Prêt à mettre à jour ? Consultez la documentation deYOLO11 ou explorez le dépôt GitHub pour commencer dès aujourd'hui.


Commentaires