Passer au contenu

Comparaison de modèles : YOLOv5 vs YOLOv6-3.0 pour la détection d’objets

Choisir le modèle de détection d'objets optimal est essentiel pour la réussite des applications de vision par ordinateur. Ultralytics YOLOv5 et Meituan YOLOv6-3.0 sont tous deux des choix populaires reconnus pour leur efficacité et leur précision. Cette page fournit une comparaison technique pour vous aider à décider quel modèle convient le mieux aux besoins de votre projet. Nous examinons en profondeur leurs nuances architecturales, leurs benchmarks de performance, leurs approches de formation et leurs applications appropriées, en soulignant les atouts de l'écosystème Ultralytics.

Ultralytics YOLOv5 : la norme industrielle établie

Auteurs : Glenn Jocher
Organisation : Ultralytics
Date : 2020-06-26
GitHub : https://github.com/ultralytics/yolov5
Docs : https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 est un modèle de détection d'objets en une seule étape, réputé pour sa rapidité, sa facilité d'utilisation et son adaptabilité. Développé par Ultralytics, il représente une étape importante dans l'accessibilité de la détection d'objets de haute performance. Construit entièrement en PyTorchYOLOv5 dispose d'un backbone CSPDarknet53 et d'un cou PANet pour une extraction et une fusion efficaces des caractéristiques. Son architecture est hautement modulaire, ce qui permet une mise à l'échelle facile à travers différentes tailles de modèles (n, s, m, l, x) pour répondre à diverses exigences de performance.

Points forts de YOLOv5

  • Vitesse et efficacité : YOLOv5 excelle en vitesse d’inférence, ce qui le rend idéal pour les applications en temps réel et le déploiement sur des appareils périphériques aux ressources limitées. Comme le montre le tableau des performances, le modèle YOLOv5n offre les temps d’inférence CPU et GPU les plus rapides parmi les modèles plus petits.
  • Facilité d'utilisation : Reconnu pour sa simplicité, YOLOv5 offre une expérience utilisateur simplifiée avec une API simple, une documentation exhaustive et de nombreux tutoriels.
  • Écosystème bien maintenu : Bénéficie de l'écosystème Ultralytics intégré, comprenant un développement actif, un fort soutien de la communauté via Discord, des mises à jour fréquentes et une intégration transparente avec Ultralytics HUB pour MLOps.
  • Polyvalence : Prend en charge plusieurs tâches, notamment la détection d'objets, la segmentation d'instance et la classification d'images, offrant une solution plus complète que les modèles à tâche unique.
  • Efficacité de l'entraînement : Offre des processus d'entraînement efficaces, des poids pré-entraînés facilement disponibles et des besoins en mémoire inférieurs à ceux de nombreuses autres architectures, en particulier les modèles basés sur des transformateurs.

Faiblesses de YOLOv5

  • Précision : Bien que très précis et efficace, les modèles plus récents comme YOLOv6-3.0 ou Ultralytics YOLOv8 pourraient offrir un mAP légèrement supérieur sur certains bancs d’essai, en particulier les variantes de modèles plus grands.
  • Détection basée sur des ancres : Repose sur des boîtes d’ancrage, ce qui peut nécessiter un réglage pour des performances optimales sur divers ensembles de données par rapport aux détecteurs sans ancres modernes.

En savoir plus sur YOLOv5

Meituan YOLOv6-3.0 : Un concurrent industriel

Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
Organisation : Meituan
Date : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/YOLOv6
Docs : https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, développé par Meituan, est un framework de détection d'objets conçu principalement pour les applications industrielles. Lancé début 2023, il visait à fournir un équilibre entre la vitesse et la précision, adapté aux scénarios de déploiement réels. YOLOv6 a introduit des modifications architecturales telles qu'une conception efficace du backbone et du neck. La version 3.0 a affiné davantage ces éléments et intégré des techniques telles que l'auto-distillation pendant l'entraînement pour améliorer les performances. Il propose également des modèles spécifiques optimisés pour le déploiement mobile (YOLOv6Lite).

Points forts de YOLOv6-3.0

  • Bon compromis vitesse-précision : Offre des performances compétitives, en particulier pour les tâches de détection d'objets industrielles où l'objectif est de maximiser le mAP sur un GPU.
  • Prise en charge de la quantification : Fournit des outils et des tutoriels pour la quantification de modèle, ce qui est bénéfique pour le déploiement sur du matériel doté de ressources limitées.
  • Optimisation mobile : Inclut les variantes YOLOv6Lite spécialement conçues pour l'inférence mobile ou basée sur le CPU.

Faiblesses de YOLOv6-3.0

  • Polyvalence limitée : Principalement axé sur la détection d'objets, il ne prend pas en charge nativement la segmentation, la classification ou l'estimation de pose que l'on retrouve dans les modèles Ultralytics tels que YOLOv5 et YOLOv8.
  • Écosystème et maintenance : Bien qu'il soit open source, l'écosystème n'est ni aussi complet ni aussi activement maintenu que la plateforme Ultralytics, ce qui pourrait entraîner des mises à jour plus lentes et un soutien communautaire moindre.
  • Utilisation plus importante des ressources : Les modèles YOLOv6 plus volumineux peuvent avoir beaucoup plus de paramètres et de FLOP que les équivalents YOLOv5 pour une mAP similaire, ce qui peut nécessiter davantage de ressources de calcul.

En savoir plus sur YOLOv6

Comparaison directe des performances

Le tableau ci-dessous fournit une comparaison directe des métriques de performance entre les modèles YOLOv5 et YOLOv6-3.0 sur le jeu de données COCO. Ultralytics YOLOv5 démontre une vitesse supérieure sur CPU et GPU pour les modèles plus petits, ce qui en fait un excellent choix pour les applications en périphérie en temps réel. Bien que les modèles YOLOv6-3.0 plus grands puissent atteindre un mAP maximal plus élevé, YOLOv5 offre une performance plus équilibrée et efficace dans l'ensemble, en particulier si l'on considère son nombre de paramètres et de FLOPs inférieur.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Méthodologie d'entraînement

Les deux modèles exploitent des techniques d'apprentissage profond standard pour l'entraînement sur de grands ensembles de données comme COCO. Cependant, Ultralytics YOLOv5 bénéficie considérablement de l'écosystème Ultralytics, offrant des flux de travail d'entraînement rationalisés, des guides exhaustifs, une optimisation AutoAnchor et une intégration avec des outils tels que Weights & Biases et ClearML pour le suivi des expériences. Cette approche intégrée simplifie le cycle de développement et accélère le délai de déploiement. L'entraînement de YOLOv6-3.0 suit les procédures décrites dans son dépôt officiel.

Cas d'utilisation idéaux

  • Ultralytics YOLOv5 : Fortement recommandé pour les applications exigeant des performances en temps réel et une facilité de déploiement, en particulier sur CPU ou les appareils périphériques. Sa polyvalence, son support étendu et son utilisation efficace des ressources en font un choix idéal pour le prototypage rapide, les applications mobiles, la vidéosurveillance (vision par ordinateur pour la prévention du vol) et les projets bénéficiant d’un écosystème mature et bien documenté.
  • Meituan YOLOv6-3.0 : Un concurrent sérieux lorsque l’optimisation de la précision sur GPU est l’objectif principal, tout en nécessitant une inférence rapide. Il convient aux applications industrielles où les légères améliorations de la mAP par rapport à YOLOv5 justifient une complexité potentiellement accrue ou un support d’écosystème moindre.

Conclusion

Ultralytics YOLOv5 reste un choix exceptionnel, particulièrement apprécié pour sa vitesse exceptionnelle, sa facilité d'utilisation et son écosystème robuste. Il offre un excellent équilibre entre performance et efficacité, soutenu par une documentation complète et un support communautaire, le rendant très accessible aux développeurs et aux chercheurs.

YOLOv6-3.0 offre des performances compétitives, en particulier en termes de mAP maximal pour les modèles plus grands sur GPU. Il constitue une alternative viable pour les utilisateurs qui privilégient la plus haute précision possible dans un framework YOLO pour des tâches industrielles spécialisées.

Pour ceux qui recherchent les dernières avancées, envisagez d'explorer les nouveaux modèles Ultralytics tels que YOLOv8, YOLOv9, YOLOv10 et YOLO11, qui offrent d'autres améliorations en termes de performances, de polyvalence et d'efficacité. Les modèles spécialisés tels que RT-DETR offrent également des avantages uniques pour des cas d'utilisation spécifiques.

Explorez toute la gamme d'options dans la Documentation des modèles Ultralytics.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires