YOLOv7 YOLO11: comparaison technique des détecteurs en temps réel
L'évolution des architectures de détection d'objets a été marquée par des progrès rapides en termes de vitesse, de précision et de facilité de déploiement. Ce guide fournit une comparaison technique approfondie entre YOLOv7, un modèle de pointe datant de 2022, et YOLO11, une version de pointe lancée par Ultralytics 2024. Nous analysons leurs différences architecturales, leurs mesures de performance et leur adéquation aux applications modernes de vision par ordinateur.
Résumé
Alors que YOLOv7 des améliorations architecturales significatives telles que E-ELAN, YOLO11 représente un bond générationnel en termes de convivialité, de prise en charge de l'écosystème et d'efficacité. YOLO11 des performances supérieures sur le matériel moderne, des workflows de formation nettement plus faciles et une prise en charge native d'un éventail plus large de tâches allant au-delà de la simple détection.
| Fonctionnalité | YOLOv7 | YOLO11 |
|---|---|---|
| Architecture | E-ELAN, basé sur la concaténation | C3k2, SPPF, optimisé pour GPU |
| Tâches | Détection, pose, segmentation (limitée) | Détecter, segmenter, classifier, pose, OBB, track |
| Facilité d'utilisation | Haute complexité (scripts multiples) | Simplifié ( Python unifiée) |
| Écosystème | Dispersé (Thème de recherche) | Intégré (Ultralytics ) |
| Déploiement | Nécessite des scripts d'exportation manuels | Exportation en une seule ligne vers plus de 10 formats |
Analyse détaillée
YOLOv7: l'architecture « Bag-of-Freebies »
Sorti en juillet 2022, YOLOv7 conçu pour repousser les limites de la détection d'objets en temps réel en optimisant le processus d'entraînement sans augmenter le coût de l'inférence, un concept connu sous le nom de « bag-of-freebies ».
Caractéristiques techniques principales :
- E-ELAN (Extended Efficient Layer Aggregation Network) : cette architecture permet au réseau d'apprendre des caractéristiques plus diverses en contrôlant les chemins de gradient les plus courts et les plus longs, améliorant ainsi la convergence.
- Mise à l'échelle du modèle : YOLOv7 des méthodes de mise à l'échelle composées qui modifient simultanément la profondeur et la largeur pour différentes contraintes de ressources.
- Tête auxiliaire : elle utilise un assignateur d'étiquettes guidé par une ligne « grossière à fine », où une tête auxiliaire aide à superviser le processus d'apprentissage dans les couches plus profondes.
Détails de YOLOv7 :
- Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
- Organisation : Institut des sciences de l'information, Academia Sinica
- Date : 06/07/2022
- Arxiv : 2207.02696
- GitHub : WongKinYiu/yolov7
YOLO11 : Efficacité et polyvalence raffinées
YOLO11 sur Ultralytics , qui privilégie l'expérience des développeurs au même titre que les performances brutes. Il introduit des améliorations architecturales qui réduisent la charge de calcul tout en conservant une grande précision, ce qui le rend exceptionnellement rapide à la fois sur les appareils périphériques et les GPU cloud.
Caractéristiques techniques principales :
- Bloc C3k2 : une évolution du goulot d'étranglement CSP (Cross Stage Partial) utilisé dans les versions précédentes, offrant une meilleure extraction des caractéristiques avec moins de paramètres.
- SPPF amélioré : la couche Spatial Pyramid Pooling - Fast est optimisée pour capturer plus efficacement le contexte multi-échelle.
- Polyvalence des tâches : contrairement à YOLOv7, qui est principalement un modèle de détection doté de certaines capacités de pose, YOLO11 conçu dès le départ pour gérer nativement la segmentation d'instances, l'estimation de pose, les boîtes englobantes orientées (OBB) et la classification.
- Entraînement optimisé : YOLO11 des stratégies avancées d'augmentation des données et des fonctions de perte améliorées qui stabilisent l'entraînement, nécessitant moins de réglages d'hyperparamètres de la part de l'utilisateur.
YOLO11 :
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 27 septembre 2024
- Docs : Documentation officielle
Comparaison des performances
Lorsque l'on compare ces modèles, il est essentiel d'examiner le compromis entre la vitesse (latence) et la précision (mAP). YOLO11 offre YOLO11 un meilleur équilibre, avec une précision élevée, des exigences informatiques nettement inférieures (FLOP) et des vitesses d'inférence plus rapides sur les GPU modernes tels que le NVIDIA .
L'efficacité compte
YOLO11 une précision comparable ou supérieure à celle des anciens modèles avec moins de paramètres. Cette « efficacité des paramètres » se traduit directement par une utilisation moindre de la mémoire pendant l'entraînement et une exécution plus rapide sur les appareils périphériques tels que le NVIDIA Orin Nano.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Comme le montre le tableau, YOLO11x surpasse YOLOv7 en termes de précision (54,7 % contre 53,1 %) tout en conservant des vitesses GPU comparables. Plus important encore, les variantes plus petites de YOLO11 n/s/m) offrent des avantages incroyables en termes de vitesse pour les applications où le traitement en temps réel est essentiel, telles que l'analyse vidéo.
Écosystème et facilité d'utilisation
Le facteur de différenciation le plus important pour les développeurs est l'écosystème qui entoure le modèle. C'est là que Ultralytics excellent.
L'avantage Ultralytics
YOLO11 est intégré au ultralytics Python fournissant une interface unifiée pour l'ensemble du cycle de vie de l'apprentissage automatique.
- API simple : vous pouvez charger, entraîner et valider un modèle à l'aide de quelques lignes de Python seulement.
- Écosystème bien entretenu : la Ultralytics fournit une assistance active, des mises à jour fréquentes et une intégration transparente avec des outils tels que Ultralytics pour la gestion des données.
- Flexibilité de déploiement : l'exportation YOLO11 ONNX, TensorRT, CoreML ou TFLite une seule commande. En revanche, YOLOv7 nécessite YOLOv7 des référentiels tiers complexes ou des ajustements manuels des scripts pour différents formats d'exportation.
Comparaison des codes :
Formation YOLO11:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Formation YOLOv7: Nécessite généralement le clonage du dépôt, l'installation de dépendances spécifiques et l'exécution de longs arguments en ligne de commande :
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
Cas d'utilisation concrets
Quand choisir YOLOv7
- Benchmarking hérité : si vous menez des recherches universitaires et devez comparer de nouvelles architectures aux normes de pointe de 2022.
- Implémentations personnalisées spécifiques : si vous disposez d'un pipeline existant fortement personnalisé autour des tensor YOLOv7 spécifiques YOLOv7 et que vous ne pouvez pas vous permettre de le refactoriser.
Quand choisir YOLO11
- Déploiement en production : pour les applications commerciales dans les domaines de la vente au détail, de la sécurité ou de la fabrication, où la fiabilité et la facilité d'entretien sont primordiales.
- Edge Computing : L'efficacité de YOLO11n et YOLO11s les rend idéaux pour fonctionner sur Raspberry Pi ou des appareils mobiles à puissance limitée.
- Applications multitâches : si votre projet nécessite de détecter des objets, de les segmenter et d'estimer leur pose simultanément, YOLO11 cela de manière native.
À la pointe de la technologie : YOLO26
Bien que YOLO11 un excellent choix pour la plupart des applications, Ultralytics d'innover. Le YOLO26 (janvier 2026), récemment commercialisé, repousse encore plus loin les limites.
- NMS de bout en bout : YOLO26 élimine la suppression non maximale (NMS), ce qui simplifie les pipelines de déploiement et réduit la latence.
- Optimisation de la périphérie : en supprimant la perte focale de distribution (DFL), YOLO26 atteint CPU jusqu'à 43 % plus rapide, ce qui en fait le choix idéal pour l'IA de périphérie.
- Optimiseur MuSGD : inspiré de la formation LLM, cet optimiseur hybride garantit une convergence stable.
Pour les développeurs qui se lancent aujourd'hui dans un nouveau projet haute performance, il est fortement recommandé d'explorer YOLO26.
Conclusion
YOLOv7 YOLO11 tous deux des étapes importantes dans l'histoire de la vision par ordinateur. YOLOv7 des concepts architecturaux puissants qui ont fait progresser le domaine. Cependant, YOLO11 affine ces idées pour en faire un ensemble plus pratique, plus rapide et plus convivial.
Pour la grande majorité des utilisateurs, des chercheurs aux ingénieurs d'entreprise,YOLO11 ou la nouvelle version YOLO26) offre la meilleure combinaison de précision, de rapidité et d'expérience développeur, soutenue par la Ultralytics robuste Ultralytics .
Autres modèles à explorer
- YOLO26: le tout dernier modèle NMS pour une vitesse et une précision optimales.
- YOLOv10: Le pionnier de l'entraînement NMS pour la détection en temps réel.
- RT-DETR: un détecteur à transformateur pour les scénarios de haute précision.
- SAM : Modèle Meta Segment Anything pour la segmentation sans apprentissage.