Passer au contenu

YOLOv6.0 vs YOLOv5: comparaison technique des détecteurs d'objets en temps réel

Le domaine de la détection d'objets en temps réel a connu une évolution rapide, plusieurs architectures se disputant la première place en termes de vitesse et de précision. Deux étapes importantes dans cette évolution sont YOLOv6.YOLOv6 et YOLOv5. Bien que les deux partagent la lignée «YOLO » (You Only Look Once), ils divergent considérablement dans leurs philosophies de conception, leurs objectifs d'optimisation et leurs cas d'utilisation prévus.

Ce guide fournit une analyse technique approfondie de ces deux modèles, aidant les développeurs et les ingénieurs à choisir l'outil adapté à leurs applications de vision par ordinateur. Nous explorerons leurs différences architecturales, leurs performances de référence et leur positionnement par rapport à des solutions modernes telles Ultralytics .

Aperçu des indicateurs de performance

Le tableau ci-dessous met en évidence les performances des deux modèles sur l'ensemble COCO , une référence standard pour la détection d'objets.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv6.0 : le poids lourd industriel

YOLOv6.YOLOv6, souvent appelé «YOLOv6 .0 : A Full-Scale Reloading », a été développé par des chercheurs de Meituan. Sorti en janvier 2023, il est spécialement conçu pour les applications industrielles où du matériel dédié, en particulier NVIDIA , est disponible.

Architecture et conception

YOLOv6 une structure de base fortement modifiée inspirée de RepVGG. Cette architecture utilise une reparamétrisation structurelle, permettant au modèle d'avoir une topologie complexe à plusieurs branches pendant l'entraînement, mais de se réduire à une pile simple et rapide de convolutions 3x3 pendant l'inférence.

Les principales caractéristiques comprennent :

  • Conception sans ancrage : élimine la complexité du réglage des hyperparamètres de la boîte d'ancrage, simplifiant ainsi le processus d'apprentissage.
  • Attribution d'étiquettes SimOTA : stratégie avancée d'attribution d'étiquettes qui associe de manière dynamique les objets réels aux prédictions, améliorant ainsi la convergence.
  • Prise en compte de la quantification : le modèle est conçu dans le respect de la méthode d'apprentissage tenant compte de la quantification (QAT), ce qui garantit une perte de précision minimale lors de la conversion en INT8 pour le déploiement sur TensorRT.

Points forts et faiblesses

La principale force de YOLOv6 réside dans son débit brut sur les GPU. Grâce à une optimisation pour les opérations compatibles avec le matériel, il atteint un nombre d'images par seconde impressionnant sur des appareils tels que le Tesla T4. Cependant, cette spécialisation a un coût. L'architecture reparamétrée peut s'avérer moins efficace sur les CPU ou les appareils mobiles où la bande passante mémoire constitue un goulot d'étranglement. De plus, son écosystème est plus fragmenté que l'expérience unifiée offerte par Ultralytics.

En savoir plus sur YOLOv6

YOLOv5: la norme polyvalente

YOLOv5, créé par Glenn Jocher et l'Ultralytics , a révolutionné l'accessibilité de la détection d'objets. Depuis sa sortie en juin 2020, il est devenu l'un des modèles d'IA visuelle les plus utilisés au monde, réputé pour sa simplicité « zéro à héros ».

Architecture et conception

YOLOv5 une infrastructure CSPDarknet, qui équilibre les capacités d'extraction de caractéristiques et l'efficacité computationnelle. Il a introduit plusieurs innovations qui sont désormais courantes, telles que la couche Focus (dans les premières versions) et l'utilisation généralisée des fonctions d'activation SiLU.

Les principales caractéristiques comprennent :

  • Écosystème centré sur l'utilisateur : YOLOv5 pas seulement un modèle, c'est un cadre complet. Il comprend des intégrations transparentes pour l'augmentation des données, l'évolution des hyperparamètres et le déploiement.
  • Prise en charge matérielle étendue : contrairement aux modèles optimisés uniquement pour les GPU haut de gamme, YOLOv5 de manière fiable sur les CPU, les appareils périphériques tels que le Raspberry Pi et les puces mobiles via TFLite.
  • Capacités multitâches : au-delà de la simple détection, YOLOv5 la segmentation et la classification d'instances, ce qui en fait un choix flexible pour les projets complexes.

Points forts et faiblesses

YOLOv5 en termes de polyvalence et de facilité d'utilisation. Ses besoins en mémoire pendant l'entraînement sont nettement inférieurs à ceux de nombreux concurrents, ce qui permet aux utilisateurs de s'entraîner sur des GPU grand public. Si des modèles plus récents peuvent le devancer en termes de performances brutes sur certains matériels spécifiques, YOLOv5 une solution robuste et éprouvée pour les applications générales.

En savoir plus sur YOLOv5

Cas d'utilisation idéaux

Quand choisir YOLOv6-3.0

YOLOv6.0 est un concurrent sérieux pour les environnements strictement industriels où :

  • GPU dédié : l'environnement de déploiement utilise exclusivement NVIDIA (tels que T4, V100 ou Jetson Orin) et TensorRT.
  • Le débit est essentiel : dans des scénarios tels que l'inspection de lignes de fabrication à grande vitesse, où quelques millisecondes de latence sur un matériel spécifique constituent le seul critère de réussite.

Quand choisir YOLOv5

YOLOv5 le choix idéal pour un large éventail d'applications :

  • CPU en périphérie et CPU : pour les appareils tels que Raspberry Pi, les téléphones mobiles ou les instances cloud CPU, l'architecture YOLOv5 offre une meilleure compatibilité et une vitesse accrue.
  • Prototypage rapide : la facilité de formation et la documentation complète permettent aux développeurs de passer d'un ensemble de données à un modèle déployé en quelques heures.
  • Formation avec des ressources limitées : si vous effectuez votre formation sur du matériel limité (par exemple, un seul GPU 8 Go de VRAM), l'efficacité YOLOv5 est inégalée.

Ultralytics : au-delà du modèle

Si l'architecture est importante, l'écosystème qui entoure un modèle détermine souvent la réussite d'un projet. Ultralytics , notamment YOLOv5 ses successeurs, offrent des avantages distincts :

  1. Facilité d'utilisation :Python Ultralytics unifie l'entraînement, la validation et l'inférence. Passez facilement de YOLOv5 à YOLO11ou YOLO26 ne nécessite que la modification d'une seule chaîne dans votre code.
  2. Écosystème bien entretenu : un développement actif, des mises à jour fréquentes et une communauté dynamique garantissent que les bugs sont rapidement corrigés et que les nouvelles fonctionnalités (comme les modèles World) sont intégrées de manière transparente.
  3. Efficacité de la formation : Ultralytics l'efficacité de la formation en fournissant des poids pré-entraînés optimisés qui convergent rapidement vers des données personnalisées.
  4. Intégration de la plateforme : la Ultralytics offre une solution sans code pour gérer les ensembles de données, former des modèles dans le cloud et les déployer sur divers terminaux sans avoir à gérer l'infrastructure.

Intégration transparente

Ultralytics prennent en charge l'exportation en un clic vers ONNX, CoreML, OpenVINOet TensorRT, ce qui réduit considérablement les efforts d'ingénierie nécessaires au déploiement.

Recommandation : L'avenir, c'est YOLO26

Pour les développeurs qui lancent de nouveaux projets en 2026, nous recommandons vivement de ne pas se limiter aux modèles traditionnels et de se tourner vers Ultralytics .

YOLO26 représente le summum de l'efficacité et de la précision. Il pallie les limites de YOLOv5 compromis entre vitesse et précision) et de YOLOv6 rigidité matérielle) grâce à une conception révolutionnaire.

  • De bout en bout natif : YOLO26 élimine le besoin de suppression non maximale (NMS), une étape de post-traitement qui complique le déploiement et ajoute de la latence. Cela rend le pipeline plus simple et plus rapide.
  • CPU : grâce à la suppression de la perte focale de distribution (DFL) et à des ajustements architecturaux spécifiques, YOLO26 atteint une inférence jusqu'à 43 % plus rapide sur les CPU, ce qui le rend idéal pour l'informatique de pointe.
  • Optimiseur MuSGD : inspiré des innovations en matière d'entraînement des modèles linguistiques à grande échelle (LLM), le nouvel optimiseur MuSGD garantit une dynamique d'entraînement stable et une convergence plus rapide, même sur des ensembles de données plus petits.
  • Détection améliorée des petits objets : l'introduction des fonctions ProgLoss et STAL améliore considérablement les performances sur les petits objets, une exigence essentielle pour les tâches d'imagerie aérienne et de télédétection.

En savoir plus sur YOLO26

Exemple de code

Ultralytics est conçue pour être cohérente entre les différentes générations de modèles. Voici à quel point il est facile de charger et d'exécuter une inférence, que vous utilisiez YOLOv5 le modèle recommandé YOLO26.

from ultralytics import YOLO

# Load the recommended YOLO26 model (or YOLOv5)
# Switch to 'yolov5s.pt' to use YOLOv5
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# The predict method returns a list of Result objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.show()  # Display result to screen
    result.save(filename="result.jpg")  # Save result to disk

Pour les utilisateurs intéressés par d'autres fonctionnalités de pointe, pensez à explorer YOLO pour la détection à vocabulaire ouvert ou RT-DETR pour une précision basée sur un transformateur.

Conclusion

YOLOv6.0 et YOLOv5 ont joué un rôle essentiel dans l'avancement de la vision par ordinateur. YOLOv6 les limites du GPU , tandis que YOLOv5 l'accès à de puissants outils d'IA. Cependant, ce domaine évolue rapidement. Avec YOLO26, Ultralytics le meilleur des deux mondes : la vitesse d'une conception adaptée au matériel, la simplicité d'un pipeline de bout en bout et la polyvalence d'un écosystème complet. Que vous déployiez votre solution dans une usine ou dans une application mobile, Ultralytics reste le choix idéal pour créer des solutions d'IA évolutives et faciles à maintenir.


Commentaires