YOLOv5 vs. YOLO26 : Évolution de la détection d'objets en temps réel
L'évolution de la détection d'objets a été marquée par des avancées significatives en matière d'efficacité et de précision. Pendant des années, YOLOv5 a été la norme de l'industrie, apprécié pour son équilibre entre vitesse et facilité d'utilisation. Cependant, le paysage de la vision par ordinateur évolue rapidement. Voici YOLO26, la dernière génération d'Ultralytics, qui redéfinit ce qui est possible sur les appareils périphériques et les serveurs haute performance.
Ce guide propose une comparaison technique entre le légendaire YOLOv5 et le très avancé YOLO26, analysant leurs architectures, leurs métriques de performance et leurs cas d'utilisation idéaux pour vous aider à choisir l'outil adapté à votre prochain projet de vision par ordinateur.
Comparaison en un coup d'œil
Bien que les deux modèles soient le fruit de l'engagement d'Ultralytics en faveur d'une IA accessible, ils représentent des ères différentes de philosophie de conception. YOLOv5 s'est concentré sur l'établissement d'un écosystème robuste et convivial, tandis que YOLO26 repousse les limites de la latence et de l'efficacité architecturale.
YOLOv5 : Le standard historique
Lancé en juin 2020 par Glenn Jocher, YOLOv5 a révolutionné l'accessibilité de la détection d'objets. Il fut l'un des premiers modèles à offrir une expérience d'entraînement fluide directement au sein de l'écosystème PyTorch, s'éloignant du framework Darknet de ses prédécesseurs.
- Date : 2020-06-26
- Auteurs : Glenn Jocher
- Organisation :Ultralytics
- Caractéristique clé : Détection basée sur des ancres nécessitant une suppression non maximale (NMS).
YOLOv5 reste un cheval de bataille fiable, particulièrement pour les systèmes existants où la mise à jour du pipeline d'inférence pourrait être coûteuse. Son architecture « basée sur des ancres » s'appuie sur des boîtes prédéfinies pour prédire les emplacements des objets, une méthode efficace mais qui nécessite un réglage minutieux des hyperparamètres.
YOLO26 : La nouvelle frontière
Lancé en janvier 2026 par Glenn Jocher et Jing Qiu, YOLO26 introduit des changements architecturaux radicaux conçus pour l'ère moderne de l'IA Edge. Il s'éloigne des ancres et du post-traitement complexe pour offrir une vitesse brute sans compromettre la précision.
- Date : 2026-01-14
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation :Ultralytics
- Caractéristique clé : NMS-Free de bout en bout, optimiseur MuSGD, suppression de DFL.
YOLO26 est conçu pour les développeurs qui ont besoin d'un débit maximal. En éliminant le besoin de NMS, il simplifie la logique de déploiement et réduit la latence, ce qui en fait le choix supérieur pour les applications en temps réel sur les CPU et les appareils mobiles.
Comparaison technique des performances
Les métriques suivantes mettent en évidence le saut générationnel en termes de performances. Les tests ont été effectués sur le jeu de données COCO, une référence standard pour les tâches de détection d'objets.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Points clés à retenir
- Efficacité CPU : YOLO26n est près de 2 fois plus rapide sur CPU que YOLOv5n tout en offrant un bond significatif en précision (28,0 % contre 40,9 % de mAP). Ceci est crucial pour les déploiements sur Raspberry Pi ou les appareils mobiles où les ressources GPU ne sont pas disponibles.
- Efficacité des paramètres : YOLO26x atteint une précision significativement plus élevée (57,5 % de mAP) que YOLOv5x (50,7 %) tout en utilisant près de la moitié des paramètres (55,7 M contre 97,2 M). Cette réduction de la taille du modèle diminue les exigences en mémoire et les coûts de stockage.
- Compromis Précision/Vitesse : La version « Nano » de YOLO26 surpasse la version « Small » de YOLOv5 en termes de précision, bien qu'il s'agisse d'une classe de modèle plus petite.
Mise à niveau depuis YOLOv5
Si vous utilisez actuellement YOLOv5s, passer à YOLO26n vous offrira probablement simultanément une meilleure précision et une inférence plus rapide, réduisant ainsi vos coûts de calcul et votre latence.
Plongée architecturale en profondeur
L'écart de performance provient de différences fondamentales dans la manière dont les modèles abordent le problème de la détection.
1. Conception de bout en bout sans NMS
YOLOv5 utilise une approche traditionnelle qui génère des milliers de boîtes englobantes potentielles. Une étape de post-traitement appelée Non-Maximum Suppression (NMS) est nécessaire pour les filtrer et obtenir les détections finales. Cette étape est souvent lente et difficile à accélérer sur du matériel comme les FPGA ou les NPU.
YOLO26 est nativement de bout en bout. Il utilise une stratégie d'attribution de double étiquette pendant l'entraînement qui force le modèle à prédire une seule boîte de haute qualité par objet. Ceci élimine entièrement l'étape de NMS pendant l'inférence.
- Avantage : Latence réduite et pipelines de déploiement simplifiés (pas besoin d'implémenter NMS en C++ ou CUDA pour les exportations personnalisées).
- Résultat : Jusqu'à 43 % plus rapide en inférence CPU par rapport aux générations précédentes s'appuyant sur un post-traitement lourd.
2. Fonctions de perte : Suppression du DFL et ProgLoss
YOLOv5 (et le YOLOv8 ultérieur) ont utilisé la Distribution Focal Loss (DFL) pour affiner les limites des boîtes. Bien qu'efficace, DFL ajoute une surcharge computationnelle et une complexité au processus d'exportation.
YOLO26 supprime DFL, revenant à une tête de régression simplifiée plus facile à quantifier pour un déploiement INT8. Pour compenser toute perte de précision potentielle, YOLO26 introduit ProgLoss (Progressive Loss Balancing) et STAL (Small-Target-Aware Label Assignment).
- STAL : Cible spécifiquement le problème des « petits objets », améliorant les performances sur les cibles éloignées ou minuscules—une faiblesse courante dans les versions antérieures de YOLO, y compris v5.
- ProgLoss : Ajuste dynamiquement le poids des différentes composantes de la perte pendant l'entraînement pour stabiliser la convergence.
3. L'optimiseur MuSGD
La stabilité de l'entraînement était un axe majeur pour l'équipe YOLO26. Alors que YOLOv5 s'appuyait généralement sur les optimiseurs standard SGD ou Adam, YOLO26 intègre MuSGD, un optimiseur hybride inspiré des techniques d'entraînement de Kimi K2 de Moonshot AI et des grands modèles de langage (LLM).
- Innovation : Il apporte la stabilité de l'optimisation Muon à la vision par ordinateur, permettant des taux d'apprentissage plus élevés et une convergence plus rapide sans risque de pics de perte.
Polyvalence et prise en charge des tâches
Les deux modèles sont intégrés à l'écosystème Ultralytics, ce qui signifie qu'ils prennent en charge un large éventail de tâches de vision par ordinateur. Cependant, YOLO26 intègre des améliorations architecturales spécifiques aux tâches dont YOLOv5 est dépourvu.
| Fonctionnalité | YOLOv5 | YOLO26 |
|---|---|---|
| Détection d'objets | ✅ Basé sur des ancres standard | ✅ Sans NMS, STAL pour les petits objets |
| Segmentation | ✅ Ajouté dans la v7.0 | ✅ Perte sémantique & Proto multi-échelle |
| Estimation de pose | ❌ (Disponible dans les forks) | ✅ RLE (Estimation de la vraisemblance logarithmique résiduelle) |
| OBB | ❌ (Disponible dans les forks) | ✅ Perte angulaire pour une rotation précise |
| Classification | ✅ Pris en charge | ✅ Architectures optimisées |
Le support de YOLO26 pour l'Estimation de la vraisemblance logarithmique résiduelle (RLE) en estimation de pose fournit des points clés significativement plus précis pour le suivi de la pose humaine, le rendant supérieur pour l'analyse sportive et les applications de santé.
Entraînement et utilisation
L'une des forces de l'écosystème Ultralytics est son API unifiée. Que vous utilisiez YOLOv5 (via le package moderne) ou YOLO26, le code reste cohérent et simple.
Exemple de code python
Voici comment vous pouvez entraîner et inférer avec les deux modèles en utilisant le ultralytics package. Notez que pour YOLOv5, le package moderne utilise les yolov5u poids (adaptés sans ancres) par défaut pour une meilleure compatibilité, mais la comparaison reste valable pour l'architecture.
from ultralytics import YOLO
# Load the models
model_v5 = YOLO("yolov5s.pt") # Legacy standard
model_26 = YOLO("yolo26n.pt") # New NMS-free standard
# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")
# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")
# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
La Plateforme Ultralytics (anciennement HUB) simplifie davantage cela en vous permettant de gérer les jeux de données et d'entraîner les deux modèles dans le cloud sans écrire de code, bien que YOLO26 soit la valeur par défaut recommandée pour les nouveaux projets créés sur la plateforme.
Déploiement et écosystème
YOLOv5 dispose d'un vaste écosystème hérité. Il existe des milliers de tutoriels, de dépôts tiers et d'intégrations matérielles spécifiquement écrits pour les yolov5 formats. Si vous travaillez avec un pipeline matériel rigide et plus ancien qui exige strictement la forme exacte du tensor de sortie de YOLOv5, il reste un choix viable.
Cependant, pour un déploiement moderne, YOLO26 offre des options d'exportation supérieures.
- IA Edge: La suppression de DFL et NMS rend les modèles YOLO26 significativement plus faciles à convertir vers des formats comme TensorRT et OpenVINO.
- Quantification: YOLO26 est conçu pour être compatible avec la quantification, conservant une plus grande précision lorsqu'il est converti en INT8 pour les processeurs mobiles.
Conclusion
Alors que YOLOv5 reste un modèle légendaire qui a démocratisé la détection d'objets, YOLO26 représente l'avenir. Avec sa conception de bout en bout sans NMS, la suppression des fonctions de perte lourdes et l'intégration d'optimiseurs inspirés des LLM comme MuSGD, YOLO26 offre un profil de performance que YOLOv5 ne peut tout simplement pas égaler.
Pour les développeurs qui démarrent de nouveaux projets, YOLO26 est clairement la recommandation. Il offre une précision plus élevée avec une latence plus faible, une consommation de mémoire réduite et un chemin de déploiement plus simple.
Explorer d'autres modèles
Pour les utilisateurs intéressés par des architectures spécialisées, envisagez d'explorer YOLO11, le prédécesseur direct de YOLO26 qui offre d'excellentes performances polyvalentes, ou YOLO-World pour les tâches de détection à vocabulaire ouvert où vous devez detect des objets non présents dans votre jeu d'entraînement.