Passer au contenu

YOLOv10 YOLOv6. YOLOv6: confrontation entre deux systèmes de détection d'objets en temps réel de nouvelle génération

Dans le domaine en constante évolution de la vision par ordinateur, choisir le bon modèle de détection d'objets est essentiel pour réussir. Deux architectures de premier plan, YOLOv10 et YOLOv6.YOLOv6, ont fait des progrès significatifs en matière d'équilibre entre vitesse et précision. Cette comparaison détaillée explore leurs innovations architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux afin de vous aider à choisir le modèle le mieux adapté à vos besoins de déploiement.

Si les deux modèles offrent des solutions robustes pour les applications industrielles et de recherche, Ultralytics fournit une plateforme unifiée permettant de former, valider et déployer facilement ces architectures. Que vous construisiez une infrastructure de ville intelligente ou optimisiez des lignes de fabrication, il est essentiel de comprendre les nuances de ces modèles.

Comparaison des métriques de performance

Le tableau suivant met en évidence les performances de YOLOv10 YOLOv6. YOLOv6 à différentes échelles de modèle. Les deux modèles sont évalués sur COCO , en mettant l'accent sur la précision moyenne (mAP) et la latence d'inférence sur du matériel standard.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10 : L'innovateur de bout en bout

YOLOv10, présenté par des chercheurs de l'université Tsinghua, représente un changement de paradigme dans la YOLO . Sa caractéristique la plus marquante est l'élimination de la suppression non maximale (NMS) pendant le post-traitement, obtenue grâce à une stratégie d'affectation double cohérente. Cette conception permet un véritable apprentissage et un déploiement de bout en bout, réduisant considérablement la variabilité de la latence dans les applications du monde réel.

Principales caractéristiques architecturales

  • FormationNMS: en utilisant deux attributions d'étiquettes (une-à-plusieurs pour une supervision riche et une-à-une pour une inférence efficace),YOLOv10 le goulot d'étranglement informatique du NMS.
  • Conception holistique efficace : l'architecture comprend une tête de classification légère et un sous-échantillonnage découplé spatialement et par canal, optimisant à la fois le nombre de paramètres et les FLOP.
  • Conception par blocs guidée par classement : afin de réduire la redondance, YOLOv10 une conception par blocs guidée par classement qui adapte la complexité en fonction du stade du réseau.

Auteur : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation :Université Tsinghua
Date : 23 mai 2024
Liens :arXiv | GitHub | Docs

En savoir plus sur YOLOv10

YOLOv6.0 : le poids lourd industriel

Développé par Meituan, YOLOv6.YOLOv6 se concentre principalement sur les scénarios d'application industrielle où le débit sur du matériel dédié (comme les GPU) est primordial. Il introduit la mise à jour « Reloading », qui affine le réseau pour une meilleure précision et de meilleures performances de quantification.

Principales caractéristiques architecturales

  • Concaténation bidirectionnelle (BiC) : un nouveau module dans le cou qui améliore la précision de la localisation en fusionnant mieux les caractéristiques de différentes échelles.
  • Formation assistée par ancrage (AAT) : cette stratégie permet au modèle de bénéficier de la stabilité de l'optimisation basée sur l'ancrage tout en conservant une architecture sans ancrage pour l'inférence.
  • Compatible avec la quantification : l'architecture est spécialement conçue pour minimiser la perte de précision lors de la quantification en INT8, ce qui la rend idéale pour les appareils périphériques utilisant TensorRT.

Auteur : Chuyi Li, Lulu Li, Yifei Geng, et al.
Organisation :Meituan
Date : 13 janvier 2023
Liens :arXiv | GitHub | Docs

En savoir plus sur YOLOv6

Analyse comparative

1. Latence et efficacité

YOLOv10 surpasse YOLOv10 YOLOv6. YOLOv6 en termes d'efficacité des paramètres et de FLOP. Par exemple, le modèle YOLOv10s atteint un mAP plus élevé mAP 46,3 % contre 45,0 %) avec beaucoup moins de paramètres (7,2 millions contre 18,5 millions) que YOLOv6.YOLOv6. La suppression du NMS YOLOv10 à réduire la latence et à la rendre plus prévisible, en particulier sur les CPU où la charge de post-traitement est importante. À l'inverse, YOLOv6. YOLOv6 est hautement optimisé pour GPU , affichant souvent des avantages en termes de vitesse brute dans les scénarios à lots élevés sur les GPU T4.

2. Déploiement et facilité d'utilisation

Les deux modèles sont pris en charge par Ultralytics , ce qui garantit aux développeurs un accès via une API unifiée. Cependant, la nature native de bout en bout YOLOv10 simplifie le pipeline d'exportation vers des formats tels que ONNX et CoreML, car il n'est pas nécessaire d'ajouter NMS complexes au graphe du modèle.

Conseil de déploiement

Lors du déploiement sur des périphériques de pointe tels que le Raspberry Pi ou NVIDIA , le nombre réduit de paramètres et la conception NMS YOLOv10 permettent généralement une consommation de mémoire moindre et des temps de démarrage plus rapides par rapport aux architectures plus anciennes.

3. Méthodologie de formation

YOLOv6.YOLOv6 s'appuie sur des techniques telles que l'auto-distillation et l'apprentissage assisté par ancrage pour améliorer les performances, ce qui peut augmenter le temps d'apprentissage et l'utilisation de la mémoire. YOLOv10 des attributions doubles cohérentes, qui rationalisent le calcul des pertes et convergent efficacement. Les utilisateurs qui exploitent le Plateforme Ultralytics peut entraîner les deux modèles sans se soucier de ces complexités internes, grâce à l'abstraction model.train() interface.

L'avantage Ultralytics

Le choix d'un modèle au sein de Ultralytics garantit une expérience « zéro à héros ». Contrairement aux référentiels autonomes qui peuvent manquer de documentation ou de maintenance, Ultralytics bénéficient des avantages suivants :

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Préparer l'avenir avec YOLO26

Bien que YOLOv10 YOLOv6.0 constituent d'excellents choix, le domaine continue d'évoluer. Pour les développeurs à la recherche de la technologie de pointe absolue, YOLO26 s'appuie sur la percée NMS de YOLOv10 introduit des améliorations essentielles pour le matériel de 2026.

Pourquoi passer à YOLO26 ?

  • Natif de bout en bout : tout comme YOLOv10, YOLO26 NMS nécessite NMS, ce qui garantit un pipeline de déploiement extrêmement simple.
  • Optimiseur MuSGD : inspiré de la formation LLM, cet optimiseur hybride garantit une convergence stable et réduit le besoin d'un réglage approfondi des hyperparamètres.
  • Conception Edge-First : grâce à la suppression de la perte focale de distribution (DFL) et à l'optimisation des blocs, YOLO26 offre CPU jusqu'à 43 % plus rapide, ce qui en fait le choix idéal pour les applications mobiles et IoT.
  • Spécificité des tâches : contrairement à ses prédécesseurs, YOLO26 inclut des fonctions de perte spécialisées telles que ProgLoss et STAL, améliorant la détection des petits objets et offrant une prise en charge native des tâches OBB et Pose.

En savoir plus sur YOLO26

Conclusion

YOLOv10 est le choix recommandé pour les utilisateurs qui privilégient l'efficacité des paramètres et des pipelines de déploiement simples et de bout en bout. Sa capacité à fournir une grande précision avec moins de FLOP le rend idéal pour les applications en temps réel sur divers matériels.

YOLOv6.YOLOv6 reste un concurrent sérieux pour les environnements industriels dotés d'GPU dédiée, où ses optimisations spécifiques pour TensorRT peuvent être pleinement exploitées.

Pour ceux qui recherchent des performances optimales, une polyvalence dans toutes les tâches (segmentation, pose, OBB) et une assistance à l'épreuve du temps, YOLO26 est la recommandation incontournable Ultralytics.

Lectures complémentaires


Commentaires