Passer au contenu

YOLOv5 vs YOLO11 : Une Comparaison Technique

Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre le besoin de précision, de vitesse et d'efficacité des ressources. Cette page fournit une comparaison technique détaillée entre deux modèles phares d'Ultralytics : le Ultralytics YOLOv5 largement adopté et le Ultralytics YOLO11 de pointe. Alors que YOLOv5 a établi une norme industrielle en matière de performance et de facilité d'utilisation, YOLO11 représente la prochaine évolution, offrant une précision supérieure, une plus grande polyvalence et une efficacité accrue au sein du même écosystème Ultralytics puissant.

Ultralytics YOLOv5 : la norme industrielle établie

Lancé en 2020, YOLOv5 est rapidement devenu l'un des modèles de détection d'objets les plus populaires au monde. Sa réputation repose sur une combinaison exceptionnelle de vitesse, de fiabilité et de convivialité, ce qui en fait un choix de prédilection pour d'innombrables développeurs et chercheurs.

Détails techniques :

Architecture et principales fonctionnalités

YOLOv5 est construit sur PyTorch et comprend un backbone CSPDarknet53 combiné à un neck PANet pour une agrégation efficace des caractéristiques. Son architecture est hautement évolutive, offrant une gamme de modèles allant du petit et rapide YOLOv5n au grand et précis YOLOv5x. Une caractéristique clé de YOLOv5 est sa tête de détection basée sur des ancres, qui était très efficace au moment de sa sortie.

Points forts

  • Vitesse d'inférence exceptionnelle : YOLOv5 est hautement optimisé pour une inférence rapide, ce qui en fait un choix robuste pour les applications en temps réel, en particulier sur le matériel GPU.
  • Écosystème mature : En tant que modèle bien établi, YOLOv5 bénéficie d’une communauté importante, de nombreux tutoriels et d’un vaste soutien tiers. Il a été éprouvé dans de nombreux environnements de production.
  • Facilité d'utilisation : Reconnu pour son API simple et sa documentation complète, YOLOv5 permet un prototypage et un déploiement rapides. Le modèle est intégré de manière transparente dans l'écosystème Ultralytics, y compris Ultralytics HUB pour l'entraînement sans code.
  • Efficacité de l'entraînement : YOLOv5 offre un processus d'entraînement efficace avec des poids pré-entraînés facilement disponibles, ce qui permet un apprentissage par transfert efficace et des cycles de développement plus rapides.

Faiblesses

  • Détection basée sur les ancres : Son recours à des boîtes d'ancrage prédéfinies peut parfois nécessiter un réglage minutieux pour les ensembles de données avec des objets de forme inhabituelle, une limitation résolue par les détecteurs sans ancres plus récents.
  • Plafond de précision : Bien que toujours très précis, ses performances sur des benchmarks comme COCO ont été dépassées par des architectures plus récentes comme YOLO11.

Cas d'utilisation idéaux

YOLOv5 reste un excellent choix pour les applications où la vitesse et la stabilité sont primordiales :

  • Edge Computing : Ses variantes plus petites sont parfaites pour un déploiement sur des appareils aux ressources limitées comme Raspberry Pi et NVIDIA Jetson.
  • Surveillance en temps réel : Alimente les systèmes de sécurité et les applications de surveillance qui nécessitent un FPS élevé.
  • Automatisation industrielle : Utilisée pour le contrôle qualité et l’automatisation des processus dans les environnements de fabrication.

En savoir plus sur YOLOv5

Ultralytics YOLO11 : La prochaine évolution de l’IA de vision

YOLO11 est le dernier modèle de pointe d'Ultralytics, conçu pour repousser les limites du possible en vision par ordinateur. Il s'appuie sur les succès de ses prédécesseurs, notamment YOLOv8, pour offrir des améliorations significatives en termes de précision, de vitesse et de polyvalence.

Détails techniques :

Architecture et principales fonctionnalités

YOLO11 introduit une architecture de réseau affinée avec des capacités d'extraction de caractéristiques avancées et une conception simplifiée. Une avancée majeure est sa head de détection sans ancres, qui améliore la généralisation et simplifie le processus d'entraînement. Cette conception moderne permet à YOLO11 d'atteindre une plus grande précision avec une utilisation plus efficace des paramètres, ce qui se traduit par des vitesses d'inférence plus rapides et des besoins de calcul moins importants.

Points forts

  • Performances de pointe : YOLO11 établit une nouvelle norme en matière de précision, atteignant des scores mAP plus élevés que YOLOv5 pour toutes les tailles de modèles.
  • Polyvalence améliorée : YOLO11 est un véritable framework multitâche, prenant en charge la détection d’objets, la segmentation d’instances, la classification d’images, l’estimation de pose et les boîtes englobantes orientées (OBB) dans un seul modèle unifié.
  • Efficacité supérieure : Le modèle est très efficace, offrant un meilleur compromis vitesse-précision. Notamment, il démontre une inférence significativement plus rapide sur les CPU par rapport à YOLOv5, le rendant accessible à un éventail plus large de matériel. Il nécessite également moins de mémoire pour l’entraînement et l’inférence que de nombreuses autres architectures.
  • Expérience utilisateur simplifiée : En tant que membre de l'écosystème Ultralytics, YOLO11 maintient le même engagement envers la facilité d'utilisation avec une simple API Python, une CLI puissante et une documentation complète.

Faiblesses

  • Demande de calcul pour les grands modèles : Bien qu'ils soient très efficaces, les plus grands modèles YOLO11 (par exemple, YOLO11x) nécessitent toujours des ressources de calcul importantes pour atteindre une précision maximale.
  • Intégrations en évolution : En tant que modèle plus récent, l’écosystème d’outils et d’intégrations tiers se développe rapidement, mais il n’est peut-être pas encore aussi étendu que celui de YOLOv5, qui est établi depuis longtemps.

Cas d'utilisation idéaux

YOLO11 est le choix idéal pour les nouveaux projets qui exigent les plus hauts niveaux de précision et de flexibilité :

  • Robotique avancée : Permet une interaction précise avec les objets et la navigation dans des environnements complexes et dynamiques.
  • Soins de santé et imagerie médicale : Soutien aux tâches telles que la détection de tumeurs où une haute précision est essentielle.
  • Villes intelligentes : Alimenter des systèmes sophistiqués de gestion du trafic et de sécurité publique.
  • Analyse de vente au détail : Amélioration de la gestion des stocks et analyse du comportement des clients avec une plus grande précision.

En savoir plus sur YOLO11

Comparaison des performances : YOLOv5 contre YOLO11

Les mesures de performance illustrent clairement les avancées réalisées avec YOLO11. De manière générale, les modèles YOLO11 offrent une augmentation significative du mAP tout en maintenant, voire en améliorant, la vitesse d'inférence. Par exemple, YOLO11s atteint un mAP de 47,0, ce qui est comparable à YOLOv5l, mais avec beaucoup moins de paramètres et une inférence CPU significativement plus rapide. De même, YOLO11m surpasse YOLOv5x en précision (51,5 contre 50,7 mAP) tout en étant plus de 4 fois plus rapide sur un CPU.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusion : Quel modèle devriez-vous choisir ?

Bien que YOLOv5 reste un modèle solide et fiable, YOLO11 est le successeur évident et le choix recommandé pour presque tous les nouveaux projets. Il offre un bond en avant substantiel en termes de performances, offrant une plus grande précision, une plus grande polyvalence des tâches et une efficacité améliorée sans sacrifier la facilité d'utilisation qui a rendu ses prédécesseurs si populaires.

  • Choisissez YOLOv5 si vous travaillez sur un projet existant qui l'utilise déjà, ou si votre contrainte principale est le déploiement sur du matériel où ses optimisations spécifiques de vitesse GPU offrent un avantage essentiel.

  • Choisissez YOLO11 pour toute nouvelle application. Sa précision supérieure, sa conception sans ancres, ses capacités multitâches et ses excellentes performances sur CPU et GPU en font la solution la plus puissante, la plus flexible et la plus pérenne.

Les deux modèles sont soutenus par l'écosystème robuste d'Ultralytics, assurant une expérience de développement fluide avec un excellent support et une documentation complète.

Explorer d’autres comparaisons de modèles

Si vous souhaitez savoir comment ces modèles se comparent à d'autres architectures de pointe, consultez nos autres pages de comparaison :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires