YOLOv5 vs YOLO11 : Une Comparaison Technique
Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre le besoin de précision, de vitesse et d'efficacité des ressources. Cette page fournit une comparaison technique détaillée entre deux modèles phares d'Ultralytics : le Ultralytics YOLOv5 largement adopté et le Ultralytics YOLO11 de pointe. Alors que YOLOv5 a établi une norme industrielle en matière de performance et de facilité d'utilisation, YOLO11 représente la prochaine évolution, offrant une précision supérieure, une plus grande polyvalence et une efficacité accrue au sein du même écosystème Ultralytics puissant.
Ultralytics YOLOv5 : la norme industrielle établie
Lancé en 2020, YOLOv5 est rapidement devenu l'un des modèles de détection d'objets les plus populaires au monde. Sa réputation repose sur une combinaison exceptionnelle de vitesse, de fiabilité et de convivialité, ce qui en fait un choix de prédilection pour d'innombrables développeurs et chercheurs.
Détails techniques :
- Auteurs : Glenn Jocher
- Organisation : Ultralytics
- Date : 2020-06-26
- GitHub : https://github.com/ultralytics/yolov5
- Documentation : https://docs.ultralytics.com/models/yolov5/
Architecture et principales fonctionnalités
YOLOv5 est construit sur PyTorch et comprend un backbone CSPDarknet53 combiné à un neck PANet pour une agrégation efficace des caractéristiques. Son architecture est hautement évolutive, offrant une gamme de modèles allant du petit et rapide YOLOv5n au grand et précis YOLOv5x. Une caractéristique clé de YOLOv5 est sa tête de détection basée sur des ancres, qui était très efficace au moment de sa sortie.
Points forts
- Vitesse d'inférence exceptionnelle : YOLOv5 est hautement optimisé pour une inférence rapide, ce qui en fait un choix robuste pour les applications en temps réel, en particulier sur le matériel GPU.
- Écosystème mature : En tant que modèle bien établi, YOLOv5 bénéficie d’une communauté importante, de nombreux tutoriels et d’un vaste soutien tiers. Il a été éprouvé dans de nombreux environnements de production.
- Facilité d'utilisation : Reconnu pour son API simple et sa documentation complète, YOLOv5 permet un prototypage et un déploiement rapides. Le modèle est intégré de manière transparente dans l'écosystème Ultralytics, y compris Ultralytics HUB pour l'entraînement sans code.
- Efficacité de l'entraînement : YOLOv5 offre un processus d'entraînement efficace avec des poids pré-entraînés facilement disponibles, ce qui permet un apprentissage par transfert efficace et des cycles de développement plus rapides.
Faiblesses
- Détection basée sur les ancres : Son recours à des boîtes d'ancrage prédéfinies peut parfois nécessiter un réglage minutieux pour les ensembles de données avec des objets de forme inhabituelle, une limitation résolue par les détecteurs sans ancres plus récents.
- Plafond de précision : Bien que toujours très précis, ses performances sur des benchmarks comme COCO ont été dépassées par des architectures plus récentes comme YOLO11.
Cas d'utilisation idéaux
YOLOv5 reste un excellent choix pour les applications où la vitesse et la stabilité sont primordiales :
- Edge Computing : Ses variantes plus petites sont parfaites pour un déploiement sur des appareils aux ressources limitées comme Raspberry Pi et NVIDIA Jetson.
- Surveillance en temps réel : Alimente les systèmes de sécurité et les applications de surveillance qui nécessitent un FPS élevé.
- Automatisation industrielle : Utilisée pour le contrôle qualité et l’automatisation des processus dans les environnements de fabrication.
Ultralytics YOLO11 : La prochaine évolution de l’IA de vision
YOLO11 est le dernier modèle de pointe d'Ultralytics, conçu pour repousser les limites du possible en vision par ordinateur. Il s'appuie sur les succès de ses prédécesseurs, notamment YOLOv8, pour offrir des améliorations significatives en termes de précision, de vitesse et de polyvalence.
Détails techniques :
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : https://github.com/ultralytics/ultralytics
- Docs : https://docs.ultralytics.com/models/yolo11/
Architecture et principales fonctionnalités
YOLO11 introduit une architecture de réseau affinée avec des capacités d'extraction de caractéristiques avancées et une conception simplifiée. Une avancée majeure est sa head de détection sans ancres, qui améliore la généralisation et simplifie le processus d'entraînement. Cette conception moderne permet à YOLO11 d'atteindre une plus grande précision avec une utilisation plus efficace des paramètres, ce qui se traduit par des vitesses d'inférence plus rapides et des besoins de calcul moins importants.
Points forts
- Performances de pointe : YOLO11 établit une nouvelle norme en matière de précision, atteignant des scores mAP plus élevés que YOLOv5 pour toutes les tailles de modèles.
- Polyvalence améliorée : YOLO11 est un véritable framework multitâche, prenant en charge la détection d’objets, la segmentation d’instances, la classification d’images, l’estimation de pose et les boîtes englobantes orientées (OBB) dans un seul modèle unifié.
- Efficacité supérieure : Le modèle est très efficace, offrant un meilleur compromis vitesse-précision. Notamment, il démontre une inférence significativement plus rapide sur les CPU par rapport à YOLOv5, le rendant accessible à un éventail plus large de matériel. Il nécessite également moins de mémoire pour l’entraînement et l’inférence que de nombreuses autres architectures.
- Expérience utilisateur simplifiée : En tant que membre de l'écosystème Ultralytics, YOLO11 maintient le même engagement envers la facilité d'utilisation avec une simple API Python, une CLI puissante et une documentation complète.
Faiblesses
- Demande de calcul pour les grands modèles : Bien qu'ils soient très efficaces, les plus grands modèles YOLO11 (par exemple, YOLO11x) nécessitent toujours des ressources de calcul importantes pour atteindre une précision maximale.
- Intégrations en évolution : En tant que modèle plus récent, l’écosystème d’outils et d’intégrations tiers se développe rapidement, mais il n’est peut-être pas encore aussi étendu que celui de YOLOv5, qui est établi depuis longtemps.
Cas d'utilisation idéaux
YOLO11 est le choix idéal pour les nouveaux projets qui exigent les plus hauts niveaux de précision et de flexibilité :
- Robotique avancée : Permet une interaction précise avec les objets et la navigation dans des environnements complexes et dynamiques.
- Soins de santé et imagerie médicale : Soutien aux tâches telles que la détection de tumeurs où une haute précision est essentielle.
- Villes intelligentes : Alimenter des systèmes sophistiqués de gestion du trafic et de sécurité publique.
- Analyse de vente au détail : Amélioration de la gestion des stocks et analyse du comportement des clients avec une plus grande précision.
Comparaison des performances : YOLOv5 contre YOLO11
Les mesures de performance illustrent clairement les avancées réalisées avec YOLO11. De manière générale, les modèles YOLO11 offrent une augmentation significative du mAP tout en maintenant, voire en améliorant, la vitesse d'inférence. Par exemple, YOLO11s atteint un mAP de 47,0, ce qui est comparable à YOLOv5l, mais avec beaucoup moins de paramètres et une inférence CPU significativement plus rapide. De même, YOLO11m surpasse YOLOv5x en précision (51,5 contre 50,7 mAP) tout en étant plus de 4 fois plus rapide sur un CPU.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusion : Quel modèle devriez-vous choisir ?
Bien que YOLOv5 reste un modèle solide et fiable, YOLO11 est le successeur évident et le choix recommandé pour presque tous les nouveaux projets. Il offre un bond en avant substantiel en termes de performances, offrant une plus grande précision, une plus grande polyvalence des tâches et une efficacité améliorée sans sacrifier la facilité d'utilisation qui a rendu ses prédécesseurs si populaires.
-
Choisissez YOLOv5 si vous travaillez sur un projet existant qui l'utilise déjà, ou si votre contrainte principale est le déploiement sur du matériel où ses optimisations spécifiques de vitesse GPU offrent un avantage essentiel.
-
Choisissez YOLO11 pour toute nouvelle application. Sa précision supérieure, sa conception sans ancres, ses capacités multitâches et ses excellentes performances sur CPU et GPU en font la solution la plus puissante, la plus flexible et la plus pérenne.
Les deux modèles sont soutenus par l'écosystème robuste d'Ultralytics, assurant une expérience de développement fluide avec un excellent support et une documentation complète.
Explorer d’autres comparaisons de modèles
Si vous souhaitez savoir comment ces modèles se comparent à d'autres architectures de pointe, consultez nos autres pages de comparaison :