Passer au contenu

YOLOv5 vs. YOLO26 : Évolution de la détection d'objets en temps réel

L'évolution de la détection d'objets a été marquée par des progrès significatifs en termes de vitesse, de précision et de facilité d'utilisation. Cette comparaison examine en détail YOLOv5, le modèle légendaire qui a démocratisé l'IA visuelle, et YOLO26, la dernière architecture de pointe Ultralytics pour une efficacité de pointe et des performances de bout en bout de nouvelle génération.

Ces deux modèles représentent des moments charnières dans l'histoire de la vision par ordinateur. Alors que YOLOv5 la norme en matière de convivialité et d'adoption par la communauté en 2020, YOLO26 redéfinit le paysage en 2026 avec une architecture de bout en bout NMS, une optimisation inspirée du LLM et CPU inégalées.

YOLOv5: le favori de la communauté

YOLOv5 a été lancé en juin 2020 par Ultralytics, marquant un tournant vers le développement PyTorch. Il s'est fait connaître non seulement pour ses performances, mais aussi pour sa facilité d'utilisation inégalée, rendant la vision par ordinateur avancée accessible aux développeurs et chercheurs du monde entier.

Architecture et points forts

YOLOv5 une architecture simplifiée axée sur « l'expérience utilisateur » de l'IA. Elle utilise une structure CSP-Darknet53 et un réseau d'agrégation de chemins (PANet), qui améliore la propagation des caractéristiques à différentes échelles.

Les principales caractéristiques comprennent :

  • Augmentation des données mosaïques : technique d'entraînement qui combine quatre images en une seule, améliorant considérablement la capacité du modèle à detect objets et à généraliser à de nouveaux contextes.
  • Boîtes d'ancrage à apprentissage automatique : le modèle apprend automatiquement les dimensions optimales des boîtes d'ancrage pour votre ensemble de données personnalisé avant le début de la formation.
  • Facilité de déploiement : prise en charge native de l'exportation vers des formats tels que ONNX, CoreMLet TFLite en ont fait un incontournable pour les applications mobiles et périphériques.

En savoir plus sur YOLOv5

YOLO26 : la nouvelle norme en matière d'efficacité

Sorti en janvier 2026, YOLO26 s'appuie sur l'héritage de ses prédécesseurs, mais introduit des changements architecturaux radicaux. Il est conçu pour être le modèle « edge-first » définitif, donnant la priorité à la vitesse CPU sans sacrifier les gains de précision réalisés ces dernières années.

Fonctionnalités révolutionnaires

YOLO26 intègre plusieurs innovations de pointe qui le distinguent de YOLOv5 classique YOLOv5 :

  1. Nativement de bout en bout (NMS) : contrairement à YOLOv5, qui nécessite une suppression non maximale (NMS) pour filtrer les boîtes qui se chevauchent pendant le post-traitement, YOLO26 est nativement de bout en bout. Cela élimine la variance de latence causée par NMS, garantissant des temps d'inférence cohérents, essentiels pour les systèmes de contrôle en temps réel dans la robotique et la conduite autonome.
  2. Optimiseur MuSGD : inspiré par la stabilité de l'entraînement des grands modèles linguistiques (LLM) tels que Kimi K2 de Moonshot AI, YOLO26 utilise un optimiseur hybride combinant SGD Muon. Cela apporte les propriétés de convergence des LLM aux tâches de vision.
  3. Suppression de la perte focale de distribution (DFL) : la suppression de la perte focale de distribution simplifie la structure du modèle, ce qui permet d'obtenir des exportations plus propres et une meilleure compatibilité avec les appareils périphériques et les accélérateurs à faible consommation d'énergie, tels que le Coral Edge TPU.
  4. ProgLoss + STAL : les nouvelles fonctions de perte (ProgLoss et STAL) apportent des améliorations significatives dans la reconnaissance des petits objets, un point faible traditionnel pour de nombreux détecteurs en temps réel.

En savoir plus sur YOLO26

Équilibre des performances

YOLO26 atteint un équilibre remarquable, offrant CPU jusqu'à 43 % plus rapide que les générations précédentes tout en conservant une précision supérieure. Cela le rend idéal pour les appareils dont GPU sont limitées ou indisponibles.

Comparaison technique : indicateurs de performance

Le tableau suivant met en évidence les différences de performances entre YOLOv5 YOLO26. Si YOLOv5 un modèle performant, YOLO26 affiche une efficacité et une précision supérieures à toutes les échelles du modèle.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Remarque : l'augmentation spectaculaire de la vitesse de YOLO26 sur CPU ONNX) est due à son architecture simplifiée et à la suppression des étapes complexes de post-traitement.

Méthodologies de formation et écosystème

L'un des principaux avantages des Ultralytics réside dans leur écosystème partagé. La transition de YOLOv5 YOLO26 s'effectue en toute transparence, car les deux modèles sont pris en charge par le ultralytics Python et le Plateforme Ultralytics.

Facilité d'utilisation et API

Les deux modèles exploitent une API unifiée qui simplifie l'ensemble du cycle de vie de l'IA. Que vous utilisiez l'interface CLI Python, la syntaxe reste intuitive.

from ultralytics import YOLO

# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt")  # Switch to 'yolov5s.pt' seamlessly

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Efficacité de l'entraînement

YOLOv5 a établi la norme en matière d'entraînement efficace, en introduisant des fonctionnalités telles que « AutoBatch » pour optimiser GPU . YOLO26 va encore plus loin avec l'optimiseur MuSGD. En stabilisant la dynamique d'entraînement, YOLO26 converge souvent plus rapidement, nécessitant moins d'époches pour atteindre une précision maximale. Cela se traduit par une réduction des coûts de calcul dans le cloud et des cycles d'itération plus rapides pour les chercheurs.

De plus, les besoins en mémoire réduits de YOLO26 permettent des lots plus importants sur du matériel grand public par rapport aux architectures à transformateurs lourds telles que RT-DETR.

Applications concrètes

Le choix entre ces modèles dépend souvent du matériel de déploiement et des exigences spécifiques du cas d'utilisation.

Edge Computing et IoT

Pour les applications fonctionnant sur Raspberry Pi ou sur téléphones mobiles, YOLO26 est clairement le grand gagnant. Son CPU jusqu'à 43 % plus rapide et la suppression du NMS le NMS incroyablement réactif pour des tâches telles que la gestion intelligente du stationnement ou le scan d'inventaire à l'aide d'un appareil portable. La suppression de la perte focale de distribution (DFL) simplifie également la conversion en quantification entière pour les microcontrôleurs.

Robotique et systèmes autonomes

En robotique, la cohérence de la latence est essentielle. La conception de bout en bout NMS de YOLO26 garantit un temps d'inférence déterministe, évitant ainsi le temps de traitement variable introduit par NMS les scènes deviennent encombrées. Cette fiabilité est essentielle pour les systèmes de navigation autonome et d'évitement des collisions.

Assistance pour les systèmes hérités

YOLOv5 reste un choix solide pour les systèmes existants dont le pipeline de déploiement est déjà rigoureusement défini autour de YOLOv5 (par exemple, tensor spécifiques attendues par les anciens flux binaires FPGA). Grâce à son immense communauté et à ses années d'essais intensifs, des solutions pour presque tous les cas limites sont facilement disponibles sur les forums et GitHub.

Polyvalence : au-delà de la détection

Alors que YOLOv5 pour prendre en charge la segmentation dans ses versions ultérieures (v7.0), YOLO26 a été entièrement conçu dès le départ comme un système d'apprentissage multitâche.

  • Segmentation d'instance : YOLO26 inclut des améliorations spécifiques à certaines tâches, telles que la perte de segmentation sémantique et les modules proto multi-échelles, améliorant ainsi la qualité des masques pour des tâches telles que l'analyse d'images médicales.
  • Estimation de la pose : grâce à l'estimation de la log-vraisemblance résiduelle (RLE), YOLO26 offre une précision supérieure des points clés pour l'estimation de la pose humaine dans l'analyse sportive.
  • Boîtes englobantes orientées (OBB) : pour les images aériennes et les données satellitaires, la perte d'angle spécialisée de YOLO26 résout les problèmes de délimitation courants dans la détection d'objets pivotés, ce qui le rend supérieur pour les tâches OBB.

Conclusion

YOLOv5 YOLO26 illustrent parfaitement Ultralytics à rendre l'IA facile, rapide et précise. YOLOv5 reste un outil classique et fiable, très présent dans l'industrie. Cependant, pour les nouveaux projets en 2026, YOLO26 offre une mise à niveau intéressante.

Avec sa conceptionNMS, son optimiseur MuSGD et CPU exceptionnelles, YOLO26 n'est pas seulement une mise à jour incrémentielle, c'est un bond en avant pour l'IA de pointe. En unifiant la détection, la segmentation, la pose et la classification dans un cadre unique et efficace, Ultralytics aux développeurs les meilleurs outils pour relever dès aujourd'hui les défis de demain en matière de vision par ordinateur.

Pour les développeurs intéressés par l'exploration d'autres architectures modernes, le YOLO11 offre également d'excellentes performances, bien que YOLO26 reste la recommandation numéro un pour son équilibre entre vitesse et fonctionnalités de nouvelle génération.


Commentaires