YOLO11 YOLOv5: comparaison technique complète des Ultralytics
Le choix de l'architecture de réseau neuronal appropriée est une décision cruciale pour tout projet de vision par ordinateur. À mesure que le paysage de l'intelligence artificielle évolue, les outils mis à la disposition des développeurs et des chercheurs évoluent également. Ce guide complet propose une comparaison technique approfondie entre deux modèles phares issus de la Ultralytics : le très célèbre YOLOv5 le très avancé YOLO11.
Que vous déployiez des modèles légers pour des applications d'IA en périphérie ou que vous traitiez des flux vidéo haute résolution sur des GPU cloud, comprendre les nuances architecturales, les mesures de performance et les cas d'utilisation idéaux pour ces modèles vous permettra de faire un choix fondé sur les données en fonction de vos contraintes de déploiement spécifiques.
Lignée du modèle et détails techniques
Les deux modèles reflètent l'engagement Ultralytics en faveur de la collaboration open source, des performances robustes et d'une facilité d'utilisation inégalée, ce qui les rend très appréciés par la communauté mondiale du machine learning.
YOLO11
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 27 septembre 2024
- GitHub : ultralytics
- Docs : YOLO11
YOLOv5
- Auteurs : Glenn Jocher
- Organisation : Ultralytics
- Date : 26 juin 2020
- GitHub : yolov5
- Docs : YOLOv5
Différences architecturales
L'évolution de YOLOv5 YOLO11 plusieurs changements architecturaux profonds conçus pour optimiser la précision et l'efficacité des paramètres.
YOLOv5 un pionnier dans le domaine PyTorch , en introduisant une dorsale CSPNet (Cross Stage Partial Network) hautement optimisée et un col PANet (Path Aggregation Network). Il s'appuyait sur la détection basée sur des ancres, qui nécessitait des boîtes d'ancrage prédéfinies pour prédire les limites des objets. Bien que très efficace, le réglage de ces ancres pour des ensembles de données de vision par ordinateur personnalisés pouvait s'avérer fastidieux.
En revanche, YOLO11 un paradigme de détection plus moderne, sans ancrage. Cela élimine le besoin de réglage manuel des boîtes d'ancrage, ce qui rationalise le processus d'entraînement et améliore la généralisation à travers divers ensembles de données tels que COCO . De plus, YOLO11 une tête découplée, ce qui signifie que les tâches de classification et de régression des boîtes englobantes sont traitées dans des branches distinctes. Cette séparation améliore considérablement la vitesse de convergence et la précision moyenne (mAP), en particulier pour les scénarios de détection d'objets complexes.
Métriques de performance et benchmarks
Le tableau ci-dessous compare les principaux indicateurs pour différentes tailles de modèles. Ultralytics sont réputés pour leurs faibles besoins en mémoire, consommant généralement moins CUDA pendant l'entraînement que les alternatives lourdes basées sur des transformateurs, ce qui réduit considérablement les contraintes matérielles pour se lancer.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Comme on peut le constater, YOLO11 un équilibre très favorable en termes de performances, avec mAP systématiquement supérieurs à ceux de ses YOLOv5 pour un nombre de paramètres comparable.
Méthodologies de formation et convivialité
L'un des principes fondamentaux de la Ultralytics est une facilité d'utilisation exceptionnelle, soutenue par un écosystème bien entretenu et un soutien communautaire étendu.
YOLOv5 s'appuyait YOLOv5 sur des scripts d'interface de ligne de commande (CLI) robustes (train.py, detect.py) pour l'exécution. Bien que puissants, l'intégration directe de ces scripts dans Python personnalisées nécessitait souvent des solutions de contournement.
YOLO11 cela en introduisant le système simplifié ultralytics Python . Cette API unifiée gère tout, de la formation à exportation de modèles formats tels que ONNX, OpenVINO, et TensorRT de manière native.
Déploiement simplifié grâce à Ultralytics
Pour une expérience entièrement sans code, les développeurs peuvent utiliser la Ultralytics pour annoter des données, former des modèles dans le cloud et les déployer de manière transparente sur des appareils périphériques.
Comparaison de code
Aujourd'hui, l'entraînement d'un Ultralytics est incroyablement efficace. Voici comment vous pouvez entraîner YOLO11 son Python native :
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")
Pour les systèmes existants utilisant YOLOv5, la formation via CLI comme suit :
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt
Cas d'utilisation idéaux et applications concrètes
Les deux modèles possèdent des atouts distincts adaptés à différents environnements opérationnels.
Quand utiliser YOLOv5
Malgré l'arrivée d'une nouvelle génération, YOLOv5 un outil très performant. Il est fortement recommandé pour :
- Intégration des systèmes hérités : environnements profondément intégrés aux tensor spécifiques YOLOv5 ou aux pipelines de déploiement qui ne peuvent pas être facilement refactorisés.
- Références académiques : chercheurs ayant besoin de références établies et pérennes pour mener des études académiques reproductibles dans le domaine de l'analyse d'images médicales.
Quand utiliser YOLO11
YOLO11 le choix idéal pour les pipelines de production modernes grâce à son incroyable polyvalence :
- Environnements multitâches : contrairement à YOLOv5, qui est principalement un détecteur (avec des ajouts ultérieurs en matière de segmentation), YOLO11 prend en charge YOLO11 la segmentation d'instances, la classification d'images, l'estimation de poses et la détection de boîtes englobantes orientées (OBB) dès son installation.
- Analyse vidéo haute densité : idéale pour les systèmes de circulation intelligents ou la gestion des stocks dans le commerce de détail, où il est essentiel d'obtenir une précision maximale à partir de scènes complexes.
Perspectives d'avenir : l'architecture YOLO26
Si YOLO11 une norme exceptionnelle, le domaine de la vision par ordinateur continue de progresser rapidement. Les développeurs à la recherche d'une efficacité optimale devraient également s'intéresser à la dernière version Ultralytics (sortie en janvier 2026).
YOLO26 représente une avancée considérable, spécialement conçu pour l'optimisation en périphérie et à l'échelle de l'entreprise. Parmi les innovations clés, on peut citer :
- Conception NMS de bout en bout : YOLO26 est nativement de bout en bout, éliminant le post-traitement NMS(Non-Maximum Suppression) pour un déploiement plus rapide et plus simple.
- Suppression de la perte focale de distribution (DFL) : la perte focale de distribution a été supprimée afin de simplifier l'exportation des modèles et d'améliorer la compatibilité avec les appareils à faible consommation d'énergie.
- MuSGD Optimizer : un hybride révolutionnaire entre SGD Muon, qui apporte la stabilité de l'entraînement LLM à la vision par ordinateur pour une convergence plus rapide.
- CPU jusqu'à 43 % plus rapide : fortement optimisé pour les déploiements IoT et les appareils sans GPU dédiés.
- ProgLoss + STAL : fonctions de perte considérablement améliorées qui permettent des progrès notables dans la reconnaissance des petits objets, essentielle pour l'imagerie aérienne par drone.
Résumé
Le choix entre YOLO11 YOLOv5 dépend YOLOv5 du stade de développement de votre projet. L'héritage YOLOv5 est indéniable, offrant une stabilité extrême et un soutien massif de la communauté. Cependant, pour tout nouveau projet, YOLO11 est fortement recommandé par rapport aux générations précédentes. Il combine une précision de pointe, une Python exceptionnellement élégante et une mémoire de formation moins gourmande, consolidant ainsi la position Ultralytics à la pointe de l'innovation en matière d'IA. Pour ceux qui souhaitent repousser encore plus loin les limites, l'exploration du YOLO26 de pointe sur la Ultralytics donnera des résultats inégalés.