Link to this sectionYOLOv5 vs YOLO11#
Lorsque tu choisis la bonne architecture de vision par ordinateur pour un nouveau projet, comprendre l'évolution des modèles de pointe est crucial. La progression des architectures antérieures vers les frameworks unifiés modernes met en évidence des avancées significatives tant dans l'efficacité algorithmique que dans l'expérience développeur. Ce guide fournit une comparaison technique approfondie entre deux modèles emblématiques développés par Ultralytics : le pionnier YOLOv5 et le très raffiné YOLO11.
Link to this sectionIntroduction aux modèles#
Ces deux architectures représentent des étapes importantes dans le domaine de la détection d'objets en temps réel, offrant des avantages distincts selon ton environnement de déploiement et tes exigences en matière d'héritage.
Link to this sectionYOLOv5 : Le pilier de l'industrie#
Sorti à l'été 2020, YOLOv5 est rapidement devenu une norme industrielle grâce à son implémentation native PyTorch, qui a considérablement abaissé la barrière à l'entrée pour l'entraînement et le déploiement. Il s'est éloigné des frameworks C complexes Darknet de ses prédécesseurs, offrant une approche Pythonique de la construction de modèles.
- Auteurs : Glenn Jocher
- Organisation : Ultralytics
- Date : 2020-06-26
- GitHub : ultralytics/yolov5
- Docs : Documentation YOLOv5
YOLOv5 a établi une base solide pour la facilité d'utilisation et a introduit des méthodologies d'entraînement puissantes, y compris l'augmentation de données mosaïque avancée et l'auto-ancrage. Il reste incroyablement populaire auprès des chercheurs qui construisent sur une base de code bien documentée et largement testée.
Link to this sectionYOLO11 : Le Framework de Vision Unifié#
S'appuyant sur des années de retours et de recherche architecturale, YOLO11 a été introduit comme faisant partie d'un framework unifié capable de gérer nativement plusieurs tâches de vision. Au-delà des simples boîtes englobantes, il a été conçu dès le départ pour une polyvalence et une efficacité maximales.
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : ultralytics/ultralytics
- Docs : Documentation YOLO11
YOLO11 offre une expérience utilisateur simplifiée grâce au package Python ultralytics, bénéficiant d'une API simple qui unifie la détection d'objets, la segmentation d'instance, la classification, l'estimation de pose et les boîtes englobantes orientées (OBB). Il atteint un compromis très favorable entre vitesse et précision, ce qui le rend idéal pour divers scénarios de déploiement dans le monde réel.
Les deux modèles bénéficient de l'écosystème bien entretenu fourni par la Plateforme Ultralytics. Cet environnement intégré simplifie l'annotation des jeux de données, l'entraînement dans le cloud et l'exportation de modèles vers diverses cibles matérielles.
Link to this sectionComparaison des performances et des mesures#
Une comparaison directe de ces modèles révèle comment les raffinements architecturaux se traduisent par des gains de performance tangibles. Le tableau ci-dessous illustre la précision moyenne (mAP) évaluée sur le jeu de données COCO, ainsi que les vitesses d'inférence CPU et GPU et les nombres de paramètres.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionAnalyse des résultats#
Les métriques mettent en évidence un saut clair dans l'équilibre des performances atteint par YOLO11. Par exemple, le modèle YOLO11n (nano) atteint une mAP de 39,5 % contre 28,0 % pour le YOLOv5n, tout en réduisant simultanément le temps d'inférence CPU lorsqu'il est exporté via ONNX. De plus, YOLO11 maintient des besoins en mémoire remarquablement inférieurs lors de l'entraînement par rapport aux modèles lourds basés sur les Transformer, le rendant très accessible pour un déploiement sur du matériel grand public et des appareils edge.
Link to this sectionDifférences architecturales#
Les améliorations de performance dans YOLO11 découlent de plusieurs évolutions architecturales clés. Alors que YOLOv5 utilisait une architecture CSPNet standard avec des modules C3, YOLO11 a introduit des blocs d'extraction de caractéristiques plus efficaces comme C2f et plus tard C3k2, qui optimisent le flux de gradient et réduisent la surcharge computationnelle.
YOLO11 dispose également d'une tête fortement raffinée. S'éloignant de la conception basée sur les ancres des anciens modèles, les nouvelles architectures Ultralytics adoptent une approche sans ancres. Cela réduit le nombre de prédictions de boîtes, simplifiant le pipeline de post-traitement et améliorant la capacité du modèle à généraliser à travers différentes échelles et rapports d'aspect. De plus, ces modèles bénéficient d'une efficacité d'entraînement supérieure et de poids pré-entraînés facilement disponibles qui accélèrent la convergence des jeux de données affinés.
Link to this sectionImplémentation et Exemples de Code#
L'une des caractéristiques marquantes de l'écosystème Ultralytics est sa simplicité. Alors que YOLOv5 a popularisé l'utilisation de torch.hub pour une inférence rapide, YOLO11 va encore plus loin avec le package Python unifié ultralytics.
Link to this sectionEntraînement avec YOLO11#
Charger, entraîner et valider un modèle nécessite un minimum de code répétitif. L'API gère de manière transparente le réglage des hyperparamètres et la gestion des modèles.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")
# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")Link to this sectionInférence Héritée avec YOLOv5#
Si tu maintiens un pipeline plus ancien, YOLOv5 s'intègre directement au mécanisme de chargement natif de PyTorch, ce qui rend son insertion dans des scripts d'inférence existants triviale.
import torch
# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")
# Print prediction details to the console
results.print()Les deux modèles prennent en charge de nombreux formats d'exportation. Que tu vises un NVIDIA Jetson utilisant TensorRT ou une application iOS utilisant CoreML, le processus de déploiement est minutieusement documenté et soutenu par la communauté.
Link to this sectionCas d'utilisation idéaux#
Le choix entre ces modèles dépend largement du stade du cycle de vie de ton projet et de tes exigences spécifiques.
Link to this sectionQuand choisir YOLOv5#
- Maintenance de Bases de Code Héritées : Si ton environnement de production est fortement personnalisé autour de la structure du dépôt YOLOv5 ou de techniques spécifiques d'évolution des hyperparamètres.
- Bases Académiques : Lorsque tu publies des recherches nécessitant une comparaison directe avec les normes de vision par ordinateur établies en 2020-2022.
Link to this sectionQuand choisir YOLO11#
- Projets Multi-Tâches : Lorsque ton application nécessite un mélange de tâches telles que l'estimation de pose et la segmentation d'instance en utilisant une API unique et unifiée.
- Déploiements Edge : Pour les scénarios d'informatique en périphérie où extraire le maximum de mAP pour un budget computationnel donné (FLOPs) est critique.
- Solutions IA Commerciales : Idéal pour les applications d'entreprise dans le commerce de détail et la sécurité, en tirant parti du support robuste de la Plateforme Ultralytics.
Link to this sectionLa nouvelle génération : Ultralytics YOLO26#
Bien que YOLO11 représente un équilibre fantastique entre vitesse et précision, le domaine de l'intelligence artificielle évolue rapidement. Pour les développeurs commençant de nouveaux projets aujourd'hui, nous recommandons vivement d'explorer la dernière norme en matière de vision par IA : Ultralytics YOLO26.
Sorti en janvier 2026, YOLO26 introduit des avancées qui changent la donne, conçues spécifiquement pour les besoins de déploiement modernes :
- Conception de bout en bout sans NMS : S'appuyant sur des concepts pionniers dans YOLOv10, YOLO26 est nativement de bout en bout. Il élimine le besoin de post-traitement par Non-Maximum Suppression (NMS), simplifiant considérablement les pipelines de déploiement et réduisant la latence.
- Optimiseur MuSGD : Inspiré par les innovations en matière d'entraînement LLM issues de modèles comme Kimi K2 de Moonshot AI, cet hybride de SGD et de Muon assure un entraînement incroyablement stable et une convergence nettement plus rapide.
- Vitesse CPU sans précédent : En supprimant la Distribution Focal Loss (DFL), YOLO26 atteint une inférence CPU jusqu'à 43 % plus rapide, ce qui en fait le meilleur choix absolu pour les appareils edge et les environnements sans GPU dédiés.
- Fonctions de Perte Avancées : L'intégration de ProgLoss et STAL apporte des améliorations notables dans la reconnaissance de petits objets, ce qui est critique pour l'analyse par drone, l'IoT et la robotique.
- Améliorations Spécifiques aux Tâches : Il introduit des optimisations spécialisées, telles que l'estimation de log-vraisemblance résiduelle (RLE) pour la pose et une perte d'angle spécialisée pour les boîtes englobantes orientées, garantissant des performances supérieures sur toutes les tâches de vision par ordinateur.
Pour les utilisateurs intéressés par des architectures spécialisées au-delà de la détection d'objets standard, tu pourrais également explorer des modèles comme RT-DETR pour la détection basée sur les Transformer, ou YOLO-World pour le suivi et la détection à vocabulaire ouvert. Adopter ces outils bien entretenus et hautement optimisés garantit que tes pipelines de vision par ordinateur restent efficaces, scalables et à la pointe du progrès.