Passer au contenu

YOLOv6-3.0 contre YOLOv8 : Comparaison technique détaillée

Choisir le bon modèle de détection d'objets est une décision cruciale qui a un impact direct sur les performances, l'efficacité et l'évolutivité de tout projet de vision par ordinateur. Cette page fournit une comparaison technique complète entre YOLOv6-3.0, développé par Meituan, et Ultralytics YOLOv8, le modèle de pointe d'Ultralytics. Nous examinerons en profondeur leurs différences architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à sélectionner le meilleur cadre pour vos besoins. Bien que les deux modèles soient puissants, YOLOv8 se distingue par sa polyvalence supérieure, sa facilité d'utilisation et un écosystème robuste et bien entretenu.

YOLOv6-3.0

Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
Organisation : Meituan
Date : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/YOLOv6
Docs : https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0 est un framework de détection d'objets conçu en mettant l'accent sur les applications industrielles. Son développement privilégie la création d'un équilibre efficace entre la vitesse d'inférence et la précision de la détection, ce qui en fait une option viable pour les scénarios de déploiement réels où la performance est essentielle.

Architecture et principales fonctionnalités

YOLOv6-3.0 a introduit plusieurs innovations architecturales visant à améliorer l'efficacité. Il présente une conception de réseau tenant compte du matériel avec un backbone de reparamétrisation efficace et un neck simplifié (Rep-PAN). Le processus d'entraînement intègre l'auto-distillation pour améliorer les performances sans augmenter le coût de l'inférence. Le framework propose également des modèles spécialisés comme YOLOv6Lite, qui sont optimisés pour les déploiements mobiles et basés sur le CPU.

Points forts

  • Vitesse d’inférence GPU élevée : Les modèles YOLOv6-3.0 affichent d’excellentes vitesses d’inférence sur les GPU, en particulier lorsqu’ils sont optimisés avec TensorRT, ce qui les rend adaptés aux applications en temps réel avec du matériel GPU dédié.
  • Prise en charge de la quantification : Le framework fournit une bonne prise en charge et des tutoriels pour la quantification de modèle, ce qui est bénéfique pour le déploiement de modèles sur du matériel aux ressources limitées.
  • Orientation industrielle : Le modèle a été spécifiquement conçu pour les cas d'utilisation industrielle, excelle dans les scénarios où la vitesse est une préoccupation majeure.

Faiblesses

  • Polyvalence limitée : YOLOv6 est principalement un détecteur d’objets. Il ne prend pas en charge nativement d’autres tâches de vision artificielle telles que la segmentation d’instances, l’estimation de pose ou la classification d’images qui sont standard dans YOLOv8.
  • Utilisation plus importante des ressources : Pour des niveaux de précision comparables, les modèles YOLOv6 ont souvent plus de paramètres et des FLOP plus élevés que leurs homologues YOLOv8, ce qui peut entraîner une augmentation des besoins en calcul.
  • Écosystème et maintenance : Bien qu'il soit open source, l'écosystème autour de YOLOv6 n'est ni aussi complet ni aussi activement maintenu que la plateforme Ultralytics. Cela peut entraîner des mises à jour plus lentes, moins d'intégrations et un soutien communautaire moindre.

En savoir plus sur YOLOv6

Ultralytics YOLOv8

Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation : Ultralytics
Date : 2023-01-10
Arxiv : Aucun
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 est un modèle de pointe, à la fine pointe de la technologie, qui s'appuie sur le succès des versions précédentes de YOLO. Il est conçu pour être rapide, précis et facile à utiliser, offrant une plateforme complète pour un large éventail de tâches de vision par ordinateur. Son architecture et son écosystème axé sur les développeurs en font le choix recommandé pour la plupart des applications.

Architecture et principales fonctionnalités

YOLOv8 introduit d'importantes améliorations architecturales, notamment un nouveau réseau dorsal, une nouvelle tête de détection sans ancrage et une nouvelle fonction de perte. Il en résulte un modèle qui est non seulement plus précis, mais aussi plus efficace en termes de paramètres et de charge de calcul. En tant que détecteur sans ancrage, YOLOv8 simplifie la couche de sortie et améliore la généralisation.

Points forts

  • Équilibre supérieur des performances : YOLOv8 atteint un compromis exceptionnel entre la vitesse et la précision. Comme le montre le tableau ci-dessous, il offre souvent des scores mAP plus élevés avec moins de paramètres et de FLOPs par rapport à YOLOv6, ce qui le rend très efficace.
  • Polyvalence inégalée : YOLOv8 est un cadre multitâche prenant en charge la détection d’objets, la segmentation d’instance, la classification d’images, l’estimation de pose et le suivi d’objets prêts à l’emploi. Cette polyvalence permet aux développeurs d’utiliser un cadre unique et cohérent pour plusieurs applications.
  • Facilité d'utilisation : L'écosystème Ultralytics est conçu pour une expérience utilisateur simplifiée. Avec une API Python et une CLI simples, une documentation exhaustive et des poids pré-entraînés facilement disponibles, il est incroyablement simple de commencer avec YOLOv8.
  • Écosystème bien maintenu : YOLOv8 est soutenu par le développement actif d'Ultralytics, garantissant des mises à jour fréquentes, un fort soutien de la communauté via GitHub et Discord, et une intégration transparente avec des outils tels que Ultralytics HUB pour la formation et le déploiement sans code.
  • Efficacité de l'entraînement : Le modèle est conçu pour des processus d'entraînement efficaces. Il nécessite souvent moins de mémoire que d'autres architectures, en particulier les modèles basés sur des transformateurs, et bénéficie de stratégies d'augmentation des données optimisées.

Faiblesses

  • Détection de petits objets : Comme la plupart des détecteurs à une seule étape, YOLOv8 peut parfois rencontrer des difficultés à détecter les objets extrêmement petits ou densément regroupés par rapport aux détecteurs spécialisés à deux étapes.

En savoir plus sur YOLOv8

Comparaison des performances

Le tableau suivant compare les mesures de performance de différents modèles YOLOv8 et YOLOv6-3.0 sur l'ensemble de données COCO val2017. La meilleure valeur de chaque colonne est mise en évidence en gras.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

D'après les données de performance, plusieurs informations clés émergent :

  • Précision vs. Efficacité : Les modèles YOLOv8 atteignent constamment des scores mAP comparables ou légèrement meilleurs avec beaucoup moins de paramètres et de FLOPs. Par exemple, YOLOv8m atteint un mAP plus élevé (50,2 vs. 50,0) que YOLOv6-3.0m tout en utilisant environ 26 % moins de paramètres et environ 8 % moins de FLOPs.
  • Vitesse CPU vs. GPU : YOLOv6-3.0 affiche des vitesses d'inférence très compétitives sur les GPU NVIDIA T4 avec TensorRT. Cependant, YOLOv8 démontre d'excellentes performances CPU avec ONNX, un avantage essentiel pour le déploiement sur une plus large gamme d'appareils périphériques et d'instances cloud sans GPU dédiés.
  • Valeur globale : YOLOv8 offre un ensemble plus convaincant. Son efficacité architecturale se traduit par des besoins en ressources plus faibles pour un niveau de précision donné, ce qui est un avantage majeur pour les applications pratiques.

Conclusion et recommandations

Bien que YOLOv6-3.0 soit un détecteur d'objets performant avec des vitesses GPU impressionnantes pour les applications industrielles, Ultralytics YOLOv8 est le choix supérieur pour la grande majorité des utilisateurs et des projets.

Les principaux avantages de YOLOv8—sa polyvalence multitâche, son équilibre exceptionnel entre vitesse et précision, ses besoins réduits en ressources et son écosystème convivial—en font un outil plus puissant et flexible. Que vous soyez un chercheur repoussant les limites de l'IA ou un développeur construisant des solutions robustes et réelles, YOLOv8 fournit une plateforme plus complète, efficace et pérenne.

Explorer d'autres modèles

Pour ceux qui souhaitent explorer davantage, Ultralytics offre une large gamme de modèles. Vous pouvez comparer YOLOv8 avec ses prédécesseurs comme YOLOv5 et YOLOv7, ou explorer les derniers modèles de pointe comme YOLOv10 et YOLO11. De plus, des comparaisons avec d'autres architectures comme RT-DETR sont disponibles dans la documentation Ultralytics.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires