YOLOv5 vs YOLO11: une comparaison technique complète
Dans le paysage en évolution rapide de la vision par ordinateur, le choix du bon modèle de détection d'objets est essentiel pour la réussite d'un projet. Deux des étapes les plus importantes dans ce domaine sont les suivantes YOLOv5 et la version récemment publiée de YOLO11. Alors que YOLOv5 a établi une norme légendaire en matière de facilité d'utilisation et de rapidité, YOLO11 repousse les limites de la précision et de l'efficacité, en s'appuyant sur des années de recherche et de développement.
Ce guide fournit une analyse technique détaillée de ces deux architectures, afin d'aider les développeurs, les chercheurs et les ingénieurs à prendre des décisions éclairées pour leurs applications d'IA.
Ultralytics YOLOv5: Le cheval de bataille fiable
Sorti en 2020, YOLOv5 a révolutionné l'accessibilité de la détection d'objets. Il s'agit du premier modèle "You Only Look Once" implémenté nativement dans PyTorchce qui le rend incroyablement facile à former et à déployer pour les développeurs. Son équilibre entre vitesse et précision en a fait le choix de prédilection pour toutes les applications, de l'inspection industrielle aux véhicules autonomes.
Détails techniques :
- Auteurs : Glenn Jocher
- Organisation :Ultralytics
- Date : 2020-06-26
- GitHub :https://github.com/ultralytics/yolov5
- Docs :https://docs.ultralytics.com/models/yolov5/
Principales caractéristiques et architecture
YOLOv5 utilise une architecture basée sur les ancres. Il a introduit une épine dorsale CSPDarknet, qui a considérablement amélioré le flux de gradient et réduit les coûts de calcul par rapport aux itérations précédentes. Le modèle utilise un cou de réseau d'agrégation de chemins (PANet) pour stimuler le flux d'informations et intègre l'augmentation des données Mosaic pendant l'entraînement, une technique qui est devenue une norme pour améliorer la robustesse du modèle face à des objets plus petits.
Points forts
YOLOv5 est réputé pour sa stabilité et sa maturité. Avec des années de tests communautaires, l'écosystème de tutoriels, d'intégrations tierces et de guides de déploiement est vaste. Il s'agit d'un excellent choix pour les systèmes hérités ou les appareils périphériques pour lesquels des optimisations matérielles spécifiques à son architecture sont déjà en place.
Ultralytics YOLO11: L'évolution de l'état de l'art
Lancement fin 2024, YOLO11 est à la pointe de l'IA visionnaire. Il s'appuie sur les enseignements tirés de YOLOv5 et de YOLOv8 afin de proposer un modèle plus rapide, plus précis et plus efficace en termes de calcul.
Détails techniques :
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation :Ultralytics
- Date : 2024-09-27
- GitHub :https://github.com/ultralytics/ultralytics
- Docs :https://docs.ultralytics.com/models/yolo11/
Architecture et principales fonctionnalités
YOLO11 introduit d'importantes améliorations architecturales, notamment le bloc C3k2 et les modules C2PSA (Cross-Stage Partial with Spatial Attention). Contrairement à YOLOv5, YOLO11 utilise une tête de détection sans ancrage, ce qui simplifie le processus de formation en éliminant la nécessité de calculer manuellement les boîtes d'ancrage. Ce changement de conception améliore la généralisation et permet au modèle de mieux s'adapter à divers ensembles de données.
Une polyvalence inégalée
L'une des caractéristiques déterminantes de YOLO11 est sa prise en charge native de plusieurs tâches de vision par ordinateur au sein d'un cadre unique. Alors que YOLOv5 se concentrait principalement sur la détection (avec un support ultérieur pour la segmentation), YOLO11 a été conçu dès le départ pour gérer.. :
- Détection d'objets
- Segmentation d'instance
- Classification d'images
- Estimation de pose
- Boîtes englobantes orientées (OBB)
Cette polyvalence permet aux développeurs de s'attaquer à des problèmes complexes de robotique et d'analyse sans changer de cadre.
Comparaison des performances
Le passage de YOLOv5 à YOLO11 se traduit par des gains de performance substantiels. Les mesures démontrent que YOLO11 offre un meilleur compromis entre vitesse et précision.
Précision et efficacité
YOLO11 atteint systématiquement une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO par rapport aux modèles YOLOv5 de taille similaire. Par exemple, le modèle YOLO11m surpasse le modèle YOLOv5x, beaucoup plus grand, en termes de précision (51,5 contre 50,7 mAP) tout en fonctionnant avec une fraction des paramètres (20,1M contre 97,2M). Cette réduction drastique de la taille du modèle se traduit par une diminution des besoins en mémoire lors de l'apprentissage et de l'inférence, un facteur essentiel pour le déploiement sur du matériel d'IA de pointe aux ressources limitées.
Vitesse d'inférence
Grâce à des choix architecturaux optimisés, YOLO11 brille par ses vitesses d'inférence sur le CPU . Le modèle YOLO11n crée une nouvelle référence pour les applications en temps réel, avec un temps d'exécution de 56,1 ms sur l'CPU avec ONNX, ce qui est nettement plus rapide que son prédécesseur.
Efficacité de la mémoire
Les modèles Ultralytics YOLO11 sont conçus pour une utilisation optimale de la mémoire. Par rapport aux détecteurs à base de transformateurs tels que RT-DETRYOLO11 nécessite beaucoup moins de mémoire CUDA pendant l'apprentissage, ce qui le rend accessible aux développeurs équipés de GPU grand public standard.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Formation et expérience des développeurs
Les deux modèles bénéficient de l'écosystème complet d'Ultralytics , connu pour sa "facilité d'utilisation".
Intégration transparente
YOLO11 s'intègre dans l'environnement moderne ultralytics Python , qui unifie toutes les tâches au sein d'une API simple. Cela permet la formation, la validation et le déploiement en quelques lignes de code seulement.
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Bien que YOLOv5 dispose de son propre dépôt, il peut également être facilement chargé via PyTorch Hub ou utilisé dans l'écosystème plus récent pour certaines tâches. La solide documentation des deux modèles garantit que, que vous procédiez à l'ajustement des hyperparamètres ou à l'exportation vers OpenVINOle processus est simplifié.
Avantages pour l'écosystème
Choisir un modèle Ultralytics , c'est accéder à une suite d'outils bien entretenue. De l'intégration avec Comet pour le suivi des expériences à la gestion transparente des ensembles de données, l'écosystème prend en charge l'ensemble du cycle de vie des MLOps. Ce développement actif garantit la livraison régulière de correctifs de sécurité et d'améliorations des performances.
Cas d'utilisation idéaux
Quand choisir YOLOv5
- Matériel ancien : si vous disposez de périphériques existants (comme les anciens Raspberry Pis) avec des pipelines spécifiquement optimisés pour l'architecture YOLOv5 .
- Flux de travail établis : Pour les projets en mode maintenance où la mise à jour de l'architecture du modèle de base entraînerait des coûts de refonte importants.
- Optimisations GPU spécifiques : Dans les rares cas où des moteurs TensorRT spécifiques sont fortement adaptés à la structure exacte des couches de YOLOv5.
Quand choisir YOLO11
- Nouveaux développements : Pour pratiquement tous les nouveaux projets, YOLO11 est le point de départ recommandé en raison de son rapport précision/calcul supérieur.
- Applications CPU en temps réel : Les applications fonctionnant sur des processeurs standard, telles que les ordinateurs portables ou les instances cloud, bénéficient énormément des optimisations de la vitesse du CPU de YOLO11.
- Tâches complexes : Projets nécessitant une segmentation des instances ou une estimation de la pose en plus de la détection.
- Exigences de haute précision : Domaines tels que l'imagerie médicale ou l'analyse d'images satellites, où la détection de petits objets avec une grande précision est primordiale.
Conclusion
Le YOLOv5 reste un témoignage de l'efficacité et de l'accessibilité de la conception de l'IA, qui a été à l'origine d'innombrables innovations au cours des dernières années. Cependant, YOLO11 représente l'avenir. Avec son architecture avancée sans ancrage, ses scores mAP supérieurs et sa polyvalence accrue, il fournit aux développeurs un ensemble d'outils plus puissants pour résoudre les défis modernes de la vision par ordinateur.
En adoptant YOLO11, vous obtenez non seulement de meilleures performances, mais vous assurez également la pérennité de vos applications au sein de l'écosystème florissant d'Ultralytics .
Explorer d'autres modèles
Si vous souhaitez comparer ces architectures avec d'autres modèles de premier plan, consultez nos comparaisons détaillées :