YOLO11 vs YOLOv7 : Une comparaison technique détaillée
Le choix du modèle de détection d'objets optimal nécessite de comprendre les capacités spécifiques et les compromis des différentes architectures. Cette page fournit une comparaison technique entre Ultralytics YOLO11 et YOLOv7, deux modèles puissants de la lignée YOLO. Nous examinons en profondeur leurs différences architecturales, leurs benchmarks de performance et leurs cas d'utilisation idéaux pour vous aider à choisir la solution la mieux adaptée à vos projets de vision par ordinateur. Alors que YOLOv7 représentait une avancée significative dans la détection en temps réel, Ultralytics YOLO11 représente l'état de l'art actuel, offrant des performances supérieures, une plus grande polyvalence et une expérience de développement plus rationalisée.
YOLOv7 : Détection d'objets efficace et précise
YOLOv7 a été présenté comme une avancée majeure dans la détection d’objets en temps réel, en se concentrant sur l’optimisation de l’efficacité et de la précision de la formation sans augmenter les coûts d’inférence.
- Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
- Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
- Date : 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub : https://github.com/WongKinYiu/yolov7
- Docs : https://docs.ultralytics.com/models/yolov7/
Architecture et principales fonctionnalités
YOLOv7 s'appuie sur les architectures YOLO précédentes en introduisant plusieurs innovations clés. Il utilise des techniques telles que les Extended Efficient Layer Aggregation Networks (E-ELAN) et des méthodes de mise à l'échelle de modèles optimisées pour les modèles basés sur la concaténation. Une contribution majeure est le concept de « trainable bag-of-freebies », qui implique des stratégies d'optimisation appliquées pendant l'entraînement (comme les têtes auxiliaires et le guidage grossier à fin) pour améliorer la précision du modèle final sans ajouter de surcharge de calcul pendant l'inférence. YOLOv7 se concentre principalement sur la détection d'objets, mais il existe des extensions communautaires pour des tâches telles que l'estimation de la pose.
Indicateurs de performance et cas d’utilisation
Dès sa sortie, YOLOv7 a démontré des performances de pointe, offrant un équilibre convaincant entre vitesse et précision. Par exemple, le modèle YOLOv7x atteint 53,1 % de mAPtest sur l’ensemble de données MS COCO à une taille d’image de 640. Son efficacité le rend approprié pour les applications en temps réel comme les systèmes de sécurité avancés et les systèmes autonomes nécessitant une détection rapide et précise.
Points forts
- Équilibre entre précision et vitesse élevés : Offre une combinaison robuste de mAP et de vitesse d’inférence pour les tâches en temps réel.
- Entraînement efficace : Utilise des techniques d'entraînement avancées (« bag-of-freebies ») pour améliorer la précision sans augmenter le coût de l'inférence.
- Performances établies : Résultats éprouvés sur des benchmarks standard comme MS COCO.
Faiblesses
- Complexité : L’architecture et les techniques d’entraînement peuvent être complexes à saisir et à optimiser pleinement.
- Gourmand en ressources : Les modèles YOLOv7 plus grands nécessitent des ressources GPU importantes pour l'entraînement.
- Polyvalence de tâches limitée : Principalement axé sur la détection d’objets, nécessitant des implémentations distinctes pour d’autres tâches comme la segmentation ou la classification par rapport aux modèles intégrés comme YOLO11.
- Écosystème fragmenté : Manque de framework unifié, de documentation exhaustive et de maintenance active que l'on retrouve dans l'écosystème Ultralytics.
Ultralytics YOLO11 : Efficacité et polyvalence de pointe
Ultralytics YOLO11, créé par Glenn Jocher et Jing Qiu d'Ultralytics, représente la dernière évolution de la série YOLO. Lancé le 27 septembre 2024, il est conçu pour une précision supérieure, une efficacité accrue et une plus grande polyvalence des tâches dans un cadre convivial.
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : https://github.com/ultralytics/ultralytics
- Docs : https://docs.ultralytics.com/models/yolo11/
Architecture et principales fonctionnalités
L'architecture de YOLO11 intègre des techniques avancées d'extraction de caractéristiques et une conception de réseau rationalisée, ce qui se traduit par une précision accrue, souvent avec un nombre de paramètres réduit par rapport à ses prédécesseurs tels que YOLOv8 et YOLOv7. Cette optimisation permet d'obtenir des vitesses d'inférence plus rapides et des besoins de calcul moins importants, ce qui est essentiel pour le déploiement sur diverses plateformes, des appareils périphériques à l'infrastructure cloud.
Un avantage clé de YOLO11 est sa polyvalence. Il s’agit d’un modèle multi-tâches qui prend en charge nativement la détection d’objets, la segmentation d’instances, la classification d’images, l’estimation de pose et les boîtes englobantes orientées (OBB). Il s’intègre parfaitement à l’écosystème Ultralytics, offrant une expérience utilisateur rationalisée via des interfaces Python et CLI simples, une documentation complète et des poids pré-entraînés facilement disponibles pour un entraînement efficace.
Points forts
- Performance à la pointe de la technologie : Atteint des scores mAP plus élevés avec une architecture plus efficace.
- Efficacité supérieure : Excellente vitesse sur CPU et GPU, avec beaucoup moins de paramètres et de FLOPs que YOLOv7 pour une précision comparable.
- Polyvalence inégalée : Prend en charge nativement la détection, la segmentation, la classification, la pose et l’OBB dans un cadre unique et unifié.
- Facilité d'utilisation : Comporte une API simple, une documentation complète et une intégration transparente avec des outils comme Ultralytics HUB pour un entraînement et un déploiement sans code.
- Écosystème bien maintenu : Bénéficie d'un développement actif, d'une communauté forte, de mises à jour fréquentes et d'une multitude de ressources.
- Efficacité de la mémoire : Conçu pour une utilisation de la mémoire plus faible pendant l’entraînement et l’inférence, ce qui le rend plus accessible que d’autres architectures.
Faiblesses
- En tant que modèle plus récent, certaines intégrations d’outils tiers de niche peuvent encore être en développement par rapport aux modèles plus anciens et plus établis.
- Les modèles les plus grands, bien que très précis, peuvent toujours nécessiter des ressources de calcul substantielles pour l'entraînement et le déploiement.
Comparaison directe des performances : YOLO11 contre YOLOv7
Lors de la comparaison directe des mesures de performance, les avantages d'Ultralytics YOLO11 deviennent clairs. Les modèles offrent un meilleur compromis entre la précision et l'efficacité dans tous les domaines.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
D'après le tableau, plusieurs informations clés se dégagent :
- Précision et efficacité : YOLO11l atteint un mAP plus élevé (53,4) que YOLOv7x (53,1) tout en utilisant beaucoup moins de paramètres (25,3M contre 71,3M) et de FLOPs (86,9B contre 189,9B).
- Vitesse d'inférence : Les modèles YOLO11 sont nettement plus rapides, en particulier sur GPU avec TensorRT. YOLO11l est presque deux fois plus rapide que YOLOv7x sur un GPU T4. De plus, YOLO11 fournit des benchmarks robustes des performances du CPU via ONNX, une mesure essentielle pour de nombreux déploiements réels où les données YOLOv7 ne sont pas disponibles.
- Scalabilité : La famille YOLO11 offre une gamme de modèles plus large et plus efficace, du YOLO11n léger (latence de 1,5 ms) au YOLO11x de haute précision (54,7 mAP), permettant aux développeurs de trouver l'équilibre parfait pour leurs besoins spécifiques.
Pourquoi choisir Ultralytics YOLO11 ?
Bien que YOLOv7 ait été un modèle puissant pour son époque, Ultralytics YOLO11 est le choix évident pour les projets modernes de vision par ordinateur. Il surpasse non seulement YOLOv7 dans les indicateurs clés comme la précision et la vitesse, mais offre également une expérience utilisateur considérablement supérieure et un ensemble de fonctionnalités plus complet.
Les principaux avantages du choix de YOLO11 sont les suivants :
- Framework unifié : Un package unique et facile à utiliser pour de multiples tâches de vision, éliminant le besoin de jongler avec différents référentiels et environnements.
- Développement et soutien actifs : En tant qu’élément de l’écosystème Ultralytics activement maintenu, YOLO11 reçoit des mises à jour continues, des corrections de bogues et un soutien d’une grande communauté et de l’équipe de développement principale.
- Prêt pour la production : En mettant l'accent sur l'efficacité, la facilité de déploiement et l'outillage robuste, YOLO11 est conçu pour les applications du monde réel, du prototypage à la production à grande échelle.
- À l'épreuve du temps : En adoptant YOLO11, les développeurs s'alignent sur la pointe de la recherche en matière de détection d'objets et bénéficient des innovations continues d'Ultralytics.
Pour les développeurs à la recherche d'un modèle moderne, polyvalent et performant, soutenu par un écosystème robuste, Ultralytics YOLO11 est le choix définitif.
Autres comparaisons de modèles
Pour une exploration plus approfondie, consultez ces comparaisons impliquant YOLOv7, YOLO11 et d'autres modèles pertinents :
- YOLO11 vs YOLOv8
- YOLOv7 contre YOLOv8
- YOLOv7 vs YOLOv6
- RT-DETR vs YOLOv7
- Explorez les derniers modèles comme YOLOv10 et d'autres comparaisons sur notre page de comparaison principale.