Passer au contenu

YOLOv8 vs YOLOv6-3.0 : Une comparaison technique

Choisir le bon modèle de détection d'objets est une décision cruciale qui a un impact sur la performance, l'efficacité et l'évolutivité de tout projet de vision par ordinateur. Cette page fournit une comparaison technique approfondie entre deux modèles puissants : Ultralytics YOLOv8 et YOLOv6-3.0. Nous allons explorer leurs différences architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à déterminer quel modèle convient le mieux à vos besoins.

Ultralytics YOLOv8

Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation : Ultralytics
Date : 2023-01-10
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 est un modèle de pointe d'Ultralytics qui s'appuie sur le succès des versions précédentes de YOLO. En tant que modèle phare, YOLOv8 est conçu pour une performance, une polyvalence et une efficacité supérieures. Il prend en charge un large éventail de tâches d'IA de vision, y compris la détection d'objets, la segmentation d'instance, l'estimation de pose, la classification d'images et le suivi, ce qui en fait une solution complète pour les développeurs.

Architecture et principales fonctionnalités

YOLOv8 introduit plusieurs améliorations architecturales clés par rapport à ses prédécesseurs. Il utilise un détecteur sans ancrage avec une tête découplée, qui sépare les tâches de classification et de détection afin d'améliorer la précision. Le réseau dorsal a été amélioré avec le module C2f, qui remplace le module C3 que l'on trouvait dans les versions antérieures, offrant ainsi une extraction de caractéristiques plus efficace. Ces choix de conception aboutissent à un modèle qui est non seulement très précis, mais aussi efficace sur le plan computationnel, ce qui le rend adapté à un large éventail de plateformes matérielles.

Points forts

  • Équilibre supérieur des performances : YOLOv8 offre un compromis exceptionnel entre la vitesse et la précision, atteignant souvent des scores mAP plus élevés avec moins de paramètres et un coût de calcul inférieur par rapport à des concurrents comme YOLOv6-3.0.
  • Polyvalence inégalée : Il s’agit d’un modèle multitâche capable de gérer la détection, la segmentation, la classification, l’estimation de pose et le suivi dans un cadre unique et unifié. Cela élimine le besoin d’utiliser plusieurs modèles pour différentes tâches.
  • Facilité d'utilisation : YOLOv8 est conçu pour une expérience utilisateur simplifiée, comprenant une API Python et une CLI simples, une documentation exhaustive et un ensemble robuste d'intégrations.
  • Écosystème bien maintenu : En tant que modèle Ultralytics, YOLOv8 bénéficie d'un développement actif, de mises à jour fréquentes et d'un fort soutien de la communauté via GitHub et Discord. Il s'intègre de manière transparente avec Ultralytics HUB pour la formation et le déploiement sans code.
  • Efficacité de l'entraînement : Le modèle offre des processus d'entraînement efficaces avec des poids pré-entraînés facilement disponibles, nécessitant souvent moins de mémoire que d'autres architectures.

Faiblesses

  • Détection de petits objets : Comme la plupart des détecteurs à une étape, YOLOv8 peut rencontrer des difficultés avec les objets extrêmement petits ou densément regroupés par rapport aux détecteurs spécialisés à deux étapes, bien qu'il reste très performant dans la plupart des scénarios.

Cas d'utilisation idéaux

Le mélange de précision, de vitesse et de capacités multitâches de YOLOv8 le rend idéal pour un large éventail d'applications :

  • Automatisation industrielle : Pour le contrôle qualité, la détection des défauts et la surveillance des processus dans le secteur de la fabrication.
  • Sécurité et surveillance : Alimenter les systèmes de sécurité avancés pour la surveillance en temps réel et la détection des menaces.
  • Analyse de vente au détail : Amélioration de la gestion des stocks et analyse du comportement des clients.
  • Systèmes autonomes : Permet la perception dans la robotique et les voitures autonomes.
  • Soins de santé : Aide à l’analyse d’images médicales pour des tâches telles que la détection de tumeurs.

En savoir plus sur YOLOv8

YOLOv6-3.0

Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
Organisation : Meituan
Date : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/YOLOv6
Docs : https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0 est un framework de détection d'objets développé par Meituan, conçu en mettant l'accent sur l'efficacité pour les applications industrielles. Il a introduit plusieurs innovations architecturales visant à réaliser un détecteur rapide et précis adapté au déploiement dans le monde réel.

Architecture et principales fonctionnalités

YOLOv6-3.0 se caractérise par une conception de réseau neuronal tenant compte du matériel, intégrant un backbone reparamétrable (Rep-Block) qui peut être converti en une structure plus efficace pour l'inférence. Il emploie également une stratégie d'auto-distillation pendant l'entraînement pour améliorer les performances sans augmenter le coût de l'inférence. Le framework est conçu pour la détection d'objets et propose des modèles spécifiques, comme YOLOv6Lite, optimisés pour l'inférence mobile et basée sur le CPU.

Points forts

  • Vitesse d'inférence élevée : Le modèle est hautement optimisé pour la vitesse, en particulier sur les GPU, ce qui en fait un excellent candidat pour les applications ayant des exigences strictes en matière de latence.
  • Prise en charge de la quantification : YOLOv6 fournit des outils dédiés et des tutoriels pour la quantification de modèle, ce qui est bénéfique pour le déploiement sur du matériel aux ressources limitées.
  • Optimisation mobile : L’inclusion des variantes YOLOv6Lite le rend approprié pour le déploiement sur les appareils mobiles.

Faiblesses

  • Polyvalence limitée : YOLOv6 est principalement un détecteur d'objets. Il ne prend pas en charge nativement la segmentation, la classification et l'estimation de pose, qui sont des fonctionnalités standard dans Ultralytics YOLOv8, ce qui oblige les utilisateurs à trouver et à intégrer des modèles distincts pour ces tâches.
  • Écosystème et maintenance : Bien qu'il soit open source, l'écosystème YOLOv6 n'est ni aussi complet ni aussi activement maintenu que la plateforme Ultralytics. Cela peut entraîner des mises à jour plus lentes, moins d'intégrations et un soutien communautaire moindre.
  • Efficacité inférieure : comme le montre le tableau des performances, les modèles YOLOv6 plus grands ont souvent beaucoup plus de paramètres et de FLOP que les modèles YOLOv8 pour une précision similaire, ce qui entraîne des besoins de calcul plus élevés.

Cas d'utilisation idéaux

YOLOv6-3.0 est bien adapté pour :

  • Applications industrielles où la vitesse de détection d'objets est la principale préoccupation.
  • Scénarios de déploiement qui tirent fortement parti de la quantification ou qui nécessitent des modèles optimisés pour les mobiles.
  • Projets qui sont axés exclusivement sur la détection d'objets.

En savoir plus sur YOLOv6

Comparaison des performances : YOLOv8 vs YOLOv6-3.0

Le tableau suivant compare les performances des modèles YOLOv8 et YOLOv6-3.0 sur le jeu de données COCO val2017. L'analyse montre clairement les avantages d'Ultralytics YOLOv8 en termes d'efficacité et de performance équilibrée.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

D'après les données, plusieurs informations clés émergent :

  • Efficacité : Ultralytics YOLOv8 offre systématiquement une précision comparable ou supérieure avec beaucoup moins de paramètres et de FLOPs. Par exemple, YOLOv8s atteint 44,9 mAP avec seulement 11,2 millions de paramètres, tandis que YOLOv6-3.0s nécessite 18,5 millions de paramètres pour un mAP similaire de 45,0. Cette efficacité supérieure fait de YOLOv8 un choix plus léger et plus rentable.
  • Précision : Bien que les deux modèles soient compétitifs, YOLOv8x atteint le mAP le plus élevé de 53,9, ce qui en fait le modèle le plus précis de cette comparaison.
  • Performance du CPU : YOLOv8 fournit des benchmarks clairs pour l'inférence CPU, un facteur essentiel pour de nombreuses applications du monde réel où les GPU ne sont pas disponibles. L'absence de benchmarks CPU officiels pour YOLOv6-3.0 rend plus difficile l'évaluation pour de tels scénarios.

Conclusion et recommandation

Bien que YOLOv8 et YOLOv6-3.0 soient des modèles de détection d'objets performants, Ultralytics YOLOv8 se distingue comme le choix supérieur pour la majorité des utilisateurs et des applications.

Les principaux avantages de YOLOv8 résident dans son équilibre exceptionnel entre précision et efficacité, sa polyvalence inégalée dans de multiples tâches de vision par ordinateur et son écosystème convivial et bien entretenu. Pour les développeurs et les chercheurs qui ont besoin d'un framework unique, fiable et performant, capable de gérer tout, de la détection à l'estimation de pose, YOLOv8 est le grand gagnant. Son faible encombrement de calcul pour un niveau de précision donné se traduit par des coûts de déploiement réduits et une compatibilité matérielle plus large.

Pour ceux qui recherchent les toutes dernières technologies de détection d'objets, nous recommandons également d'explorer le tout nouveau Ultralytics YOLO11, qui s'appuie sur les bases solides de YOLOv8 pour offrir des performances et des capacités encore plus grandes.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires