Passer au contenu

YOLOv6-3.0 vs YOLO11 : Une comparaison détaillée des modèles

Choisir le bon modèle de vision par ordinateur est crucial pour obtenir des performances optimales dans les tâches de détection d'objets. Cette page fournit une comparaison technique entre YOLOv6-3.0 et Ultralytics YOLO11, en se concentrant sur leurs architectures, leurs mesures de performance, leurs méthodologies d'entraînement et leurs cas d'utilisation idéaux afin de vous aider à choisir la solution la mieux adaptée à votre projet. Bien que les deux soient des modèles puissants, YOLO11 représente le summum de l'efficacité et de la polyvalence.

YOLOv6-3.0

Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
Organisation : Meituan
Date : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/YOLOv6
Docs : https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, développé par Meituan, est un framework de détection d'objets conçu principalement pour les applications industrielles. Lancé début 2023, il visait à fournir un équilibre entre la vitesse et la précision, adapté aux scénarios de déploiement réels où l'inférence en temps réel est une priorité.

Architecture et principales fonctionnalités

YOLOv6 a introduit des modifications architecturales telles qu'un backbone et une conception de neck efficaces et adaptés au matériel. La version 3.0 a affiné davantage ces éléments et intégré des techniques telles que l'auto-distillation pendant l'entraînement afin d'améliorer les performances. Il propose également des modèles spécifiques optimisés pour le déploiement mobile (YOLOv6Lite), ce qui témoigne de son intérêt pour l'edge computing.

Points forts

  • Bon compromis vitesse-précision : Offre des performances compétitives, en particulier pour les tâches de détection d'objets industrielles.
  • Prise en charge de la quantification : Fournit des outils et des tutoriels pour la quantification de modèle, ce qui est bénéfique pour le déploiement sur du matériel doté de ressources limitées.
  • Optimisation mobile : Inclut les variantes YOLOv6Lite spécialement conçues pour l'inférence mobile ou basée sur le CPU.

Faiblesses

  • Polyvalence limitée : Principalement axé sur la détection d'objets, il ne prend pas en charge nativement la segmentation d'instance, la classification d'images ou l'estimation de pose que l'on retrouve dans Ultralytics YOLO11.
  • Écosystème et maintenance : Bien qu'il soit open source, l'écosystème n'est ni aussi complet ni aussi activement maintenu que la plateforme Ultralytics, ce qui pourrait entraîner des mises à jour plus lentes et un soutien communautaire moindre.
  • Utilisation plus importante des ressources : Les modèles YOLOv6 plus volumineux peuvent avoir beaucoup plus de paramètres et de FLOP que les équivalents YOLO11 pour une mAP similaire, ce qui peut nécessiter davantage de ressources de calcul, comme le montre le tableau ci-dessous.

Cas d'utilisation idéaux

YOLOv6-3.0 est bien adapté pour :

  • Applications industrielles où la vitesse de détection d'objets est essentielle, comme dans la fabrication pour le contrôle de la qualité.
  • Scénarios de déploiement tirant parti de la quantification ou nécessitant des modèles optimisés pour les appareils mobiles.
  • Projets axés uniquement sur la détection d'objets sans avoir besoin de capacités multi-tâches.

En savoir plus sur YOLOv6

Ultralytics YOLO11

Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 2024-09-27
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 est le dernier modèle de pointe d’Ultralytics, représentant la plus récente évolution de la série YOLO. Sorti en septembre 2024, il s’appuie sur les versions précédentes telles que YOLOv8 avec des améliorations architecturales visant à améliorer à la fois la vitesse et la précision. YOLO11 est conçu pour offrir des performances et une efficacité supérieures dans un large éventail de tâches de vision par ordinateur.

Architecture et principales fonctionnalités

YOLO11 dispose d'une architecture optimisée qui permet d'atteindre un équilibre affiné entre la taille du modèle, la vitesse d'inférence et la précision. Les principales améliorations comprennent des couches d'extraction de caractéristiques améliorées et une structure de réseau simplifiée, ce qui minimise la surcharge de calcul. Cette conception garantit des performances efficaces sur divers matériels, des appareils périphériques tels que le NVIDIA Jetson aux puissants serveurs cloud. En tant que détecteur sans ancres, YOLO11 simplifie le processus de détection et améliore souvent la généralisation.

Points forts

  • Équilibre supérieur des performances : Atteint des scores mAP plus élevés avec moins de paramètres et de FLOPs par rapport à ses concurrents, offrant un excellent compromis entre la vitesse et la précision.
  • Polyvalence : Prend en charge plusieurs tâches de vision au sein d'un même framework, notamment la détection, la segmentation d'instance, la classification, l'estimation de pose et les boîtes englobantes orientées (OBB), offrant une solution complète.
  • Facilité d'utilisation : Bénéficie de l'écosystème Ultralytics simplifié, comprenant une API Python simple, une documentation exhaustive et des poids pré-entraînés facilement disponibles.
  • Écosystème bien maintenu : Activement développé et pris en charge par Ultralytics, avec des mises à jour fréquentes, un fort soutien communautaire via GitHub et Discord, et une intégration avec Ultralytics HUB pour une formation et un déploiement transparents.
  • Efficacité de l'entraînement : Offre des processus d'entraînement efficaces, nécessitant souvent moins de mémoire que d'autres types de modèles comme les transformateurs.

Faiblesses

  • Nouveau modèle : En tant que dernière version, le volume de tutoriels communautaires et d’outils tiers est encore en pleine croissance par rapport aux modèles plus établis comme YOLOv5.
  • Détection de petits objets : Comme la plupart des détecteurs à une étape, peut rencontrer des difficultés avec les objets extrêmement petits par rapport aux détecteurs spécialisés à deux étapes.

Cas d'utilisation idéaux

Le mélange de précision, de vitesse et de polyvalence de YOLO11 le rend idéal pour :

  • Applications en temps réel nécessitant une haute précision, telles que les systèmes autonomes et la robotique.
  • Scénarios multi-tâches nécessitant la détection, la segmentation et l'estimation de pose simultanément.
  • Déploiement sur diverses plateformes, des appareils aux ressources limitées comme le Raspberry Pi aux infrastructures cloud puissantes.
  • Applications dans la sécurité, le commerce de détail, la santé et la logistique.

En savoir plus sur YOLO11

Comparaison des performances

Les benchmarks de performance ci-dessous, évalués sur le jeu de données COCO, illustrent clairement les avantages de YOLO11. Pour un niveau de précision comparable, les modèles YOLO11 sont nettement plus efficaces. Par exemple, YOLO11l atteint un mAPval supérieur de 53,4 avec seulement 25,3 millions de paramètres et 86,9 milliards de FLOPs, tandis que YOLOv6-3.0l n'atteint que 52,8 mAPval tout en nécessitant plus du double de paramètres (59,6 millions) et de FLOPs (150,7 milliards). Cette efficacité supérieure fait de YOLO11 un choix plus évolutif et rentable pour le déploiement.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Méthodologies d'entraînement

Les deux modèles utilisent des pratiques d'entraînement d'apprentissage profond standard. YOLOv6-3.0 emploie des techniques telles que l'auto-distillation pour améliorer les performances. Cependant, Ultralytics YOLO11 bénéficie de sa profonde intégration au sein de l'écosystème complet Ultralytics, qui offre une expérience considérablement plus rationalisée et conviviale.

La formation avec YOLO11 est simplifiée grâce à son package python et à Ultralytics HUB, qui fournit des outils pour faciliter le réglage des hyperparamètres, le chargement efficace des données et la journalisation automatique avec des plateformes comme TensorBoard et Weights & Biases. De plus, l’architecture de YOLO11 est optimisée pour l’efficacité de la formation, nécessitant souvent moins de mémoire et de temps. Les deux modèles fournissent des poids pré-entraînés sur l’ensemble de données COCO pour faciliter l’apprentissage par transfert.

Conclusion

Bien que YOLOv6-3.0 offre des performances solides pour des cas d'utilisation industriels spécifiques, Ultralytics YOLO11 apparaît comme le choix supérieur pour la plupart des développeurs et des chercheurs. YOLO11 offre une précision à la fine pointe de la technologie, une efficacité remarquable (moins de paramètres et de FLOPs pour un mAP plus élevé) et une polyvalence exceptionnelle pour plusieurs tâches de vision. Son plus grand avantage réside dans sa facilité d'utilisation inégalée, soutenue par l'écosystème Ultralytics robuste, bien documenté et activement maintenu. Cet équilibre de performance élevé le rend adapté à un plus large éventail d'applications et d'environnements de déploiement, de la périphérie au nuage.

Pour les utilisateurs qui explorent des alternatives, Ultralytics propose également d'autres modèles très performants comme YOLOv10, YOLOv9 et YOLOv8. Vous trouverez d'autres comparaisons avec des modèles tels que RT-DETR, YOLOX et YOLOv7 dans la documentation Ultralytics.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires