Passer au contenu

YOLOv7 YOLOv6. YOLOv6: trouver le juste équilibre entre innovation et rapidité dans la détection d'objets

Dans le domaine en constante évolution de la détection d'objets en temps réel, il est essentiel de choisir la bonne architecture pour optimiser les performances et l'efficacité. Cette comparaison détaillée explore YOLOv7 et YOLOv6.YOLOv6, deux modèles pivots qui ont considérablement influencé le domaine. Nous analysons leurs innovations architecturales, leurs mesures de référence et leur adéquation à diverses tâches de vision par ordinateur. De plus, nous présentons la nouvelle génération YOLO26, qui s'appuie sur ces fondements pour offrir des performances et une facilité d'utilisation supérieures.

Aperçu du modèle

YOLOv7

YOLOv7 a été conçu pour surpasser les détecteurs de pointe précédents en termes de vitesse et de précision. Il introduit un « bag-of-freebies » entraînable qui optimise l'entraînement sans augmenter le coût de l'inférence.

En savoir plus sur YOLOv7

YOLOv6-3.0

YOLOv6.YOLOv6 (également connu sous le nom de YOLOv6 .0) se concentre principalement sur les applications industrielles, en optimisant le débit matériel sur les GPU. Il fait partie de la mise à jour « reloading » qui a considérablement amélioré YOLOv6 précédentes YOLOv6 .

En savoir plus sur YOLOv6

Comparaison technique

Les deux modèles visent des performances en temps réel, mais y parviennent grâce à des philosophies architecturales différentes.

Architecture

YOLOv7 utilise un réseau d'agrégation de couches efficace étendu (E-ELAN). Cette architecture contrôle les chemins de gradient les plus courts et les plus longs, permettant au réseau d'apprendre des caractéristiques plus diverses sans détruire le flux de gradient. Elle utilise également une mise à l'échelle du modèle qui concatène les couches plutôt que de simplement mettre à l'échelle la profondeur ou la largeur, préservant ainsi la structure optimale pendant la mise à l'échelle.

YOLOv6.YOLOv6 adopte un module de concaténation bidirectionnelle (BiC) dans son cou et une conception purement sans ancrage. Il se concentre sur des structures adaptées au matériel, optimisant les coûts d'accès à la mémoire pour les GPU. La mise à jour de la version 3.0 a spécifiquement renouvelé les stratégies de tête de détection et d'attribution d'étiquettes afin d'augmenter la vitesse de convergence et la précision finale.

Mesures de performance

Le tableau suivant compare les principaux indicateurs de performance sur l'ensemble COCO .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Points forts et faiblesses

Points forts de YOLOv7 :

  • Richesse des fonctionnalités : la structure E-ELAN excelle dans la capture de détails fins, ce qui est avantageux pour la détection de petits objets.
  • Tête auxiliaire : utilise une attribution d'étiquettes guidée « grossière à fine », offrant une supervision plus stricte pendant la formation.

Points faibles de YOLOv7 :

  • Complexité : l'architecture peut être complexe à modifier ou à épurer pour un matériel embarqué spécifique.
  • NMS : nécessite un post-traitement standard de suppression non maximale, ce qui ajoute une variance de latence.

YOLOv6.0 Points forts :

  • Débit : spécialement optimisé pour les scénarios à haut débit sur Tesla T4 et les GPU similaires utilisant TensorRT.
  • Quantification : Conçu dans une optique d'apprentissage tenant compte de la quantification (QAT), ce qui facilite son déploiement en tant qu'INT8 sur les appareils périphériques.

Faiblesses de YOLOv6.0 :

  • CPU : bien qu'excellente sur GPU, son architecture est moins optimisée pour CPU purement CPU que les nouvelles variantes « Lite » ou spécifiques aux appareils mobiles.

Applications concrètes

Le choix entre ces modèles dépend en grande partie de votre matériel de déploiement et de votre cas d'utilisation spécifique.

Inspection industrielle avec YOLOv6.0

Dans les chaînes de fabrication à grande vitesse, le débit est primordial. YOLOv6.YOLOv6 est souvent le choix privilégié pour détecter les défauts sur les bandes transporteuses. Sa compatibilité avec TensorRT lui TensorRT de traiter des centaines d'images par seconde sur des GPU périphériques, garantissant ainsi qu'aucun produit défectueux ne passe entre les mailles du filet.

Surveillance complexe avec YOLOv7

Pour les applications de sécurité impliquant des scènes bondées ou une surveillance à longue distance, YOLOv7 est très efficace. Sa capacité à conserver les détails des caractéristiques le rend adapté à l'entretien urbain, comme l'identification des dommages routiers ou la surveillance du flux de circulation où les objets peuvent être petits ou partiellement masqués.

Flexibilité de déploiement

Bien que les deux modèles soient puissants, leur déploiement peut varier considérablement. YOLOv6 les environnements où vous pouvez tirer parti d'une quantification agressive (INT8), tandis que YOLOv7 conserve YOLOv7 une grande précision dans les modes FP16.

L'avantage Ultralytics

Si YOLOv7 YOLOv6 des architectures robustes, leur utilisation au sein de Ultralytics offre des avantages distincts aux développeurs et aux chercheurs. LePython Ultralytics unifie ces modèles distincts sous une API unique et rationalisée.

  • Facilité d'utilisation : vous pouvez passer de l'entraînement d'un YOLOv7 à celui d'une architecture plus récente à l'aide d'une seule ligne de code.
  • Écosystème Bien Entretenu : Ultralytics fournit des mises à jour fréquentes, assurant la compatibilité avec les dernières versions de PyTorch et les pilotes CUDA.
  • Polyvalence : au-delà de la détection standard, l'écosystème prend en charge l'estimation de la pose et la segmentation d'instances dans toutes les familles de modèles compatibles.
  • Efficacité de la formation : les pipelines Ultralytics sont optimisés pour l'efficacité de la mémoire, ce qui permet souvent d'utiliser des lots plus volumineux sur du matériel grand public que les référentiels de recherche d'origine.

Exemple de code

Voici à quel point il est facile d'expérimenter ces modèles à l'aide d'Ultralytics:

from ultralytics import YOLO

# Load a YOLOv7 model (or swap to 'yolov6n.pt')
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

L'avenir : YOLO26

Si YOLOv7 YOLOv6. YOLOv6 restent performants, le domaine a évolué. Sorti en janvier 2026, YOLO26 représente la nouvelle norme en matière d'efficacité et de performances, palliant les limites de ses prédécesseurs.

YOLO26 est conçu pour être la solution ultime pour les déploiements en périphérie et dans le cloud, avec les caractéristiques suivantes :

  • Conception NMS de bout en bout : contrairement à YOLOv7, YOLO26 est nativement de bout en bout. Il élimine le besoin de NMS , ce qui se traduit par une latence d'inférence plus rapide et déterministe, essentielle pour la robotique en temps réel.
  • Optimiseur MuSGD : inspiré des innovations dans le domaine de l'entraînement des modèles LLM (comme Kimi K2 de Moonshot AI), cet optimiseur hybride combine SGD Muon, stabilisant l'entraînement et accélérant la convergence.
  • CPU jusqu'à 43 % plus rapide : en supprimant la perte focale de distribution (DFL) et en optimisant l'architecture, YOLO26 atteint des vitesses nettement plus élevées sur les CPU, ce qui le rend supérieur pour les appareils périphériques tels que Raspberry Pi.
  • ProgLoss + STAL : les fonctions de perte avancées améliorent la reconnaissance des petits objets, un domaine critique dans lequel les anciens modèles rencontraient souvent des difficultés.

Pour les développeurs qui recherchent le meilleur équilibre entre vitesse, précision et facilité de déploiement, la transition vers YOLO26 est fortement recommandée.

En savoir plus sur YOLO26

Autres modèles à explorer

Si vous souhaitez explorer d'autres architectures dans la Ultralytics , pensez à :

  • YOLO11: La génération précédente à la pointe de la technologie, offrant un excellent équilibre entre les différentes fonctionnalités.
  • YOLOv10: Le pionnier des stratégies d'entraînement NMS dans la YOLO .
  • RT-DETR: un détecteur basé sur un transformateur qui excelle en matière de précision, mais qui nécessite davantage GPU .

En tirant parti de la Ultralytics , vous pouvez facilement comparer ces modèles à vos ensembles de données spécifiques afin de trouver celui qui convient le mieux à votre application.


Commentaires