Passer au contenu

YOLOv10 vs YOLO11 : Une comparaison technique pour la détection d'objets

La sélection du modèle de détection d'objets optimal est une décision essentielle qui équilibre la précision, la vitesse et les contraintes de déploiement. Cette page fournit une comparaison technique complète entre YOLOv10, un modèle axé sur l'efficacité de bout en bout, et Ultralytics YOLO11, le dernier modèle à la pointe de la technologie d'Ultralytics, réputé pour sa polyvalence, ses performances et sa facilité d'utilisation. Nous examinerons en détail leurs différences architecturales, leurs benchmarks de performance et leurs applications idéales pour vous aider à faire un choix éclairé.

YOLOv10 : Repousser les limites de l'efficacité

Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation : Université Tsinghua
Date : 2024-05-23
Arxiv : https://arxiv.org/abs/2405.14458
GitHub : https://github.com/THU-MIG/yolov10
Docs : https://docs.ultralytics.com/models/yolov10/

YOLOv10, introduit en mai 2024, est un modèle de détection d'objets qui privilégie les performances en temps réel et de bout en bout. Son innovation principale est l'élimination de la Suppression Non Maximale (NMS) pendant le post-traitement, qui contribue traditionnellement à la latence d'inférence. Ceci est réalisé grâce à une nouvelle stratégie d'entraînement appelée affectations doubles cohérentes.

Architecture et principales fonctionnalités

La conception de YOLOv10 est motivée par une approche holistique de l'efficacité et de la précision. Elle introduit plusieurs optimisations architecturales pour réduire la redondance de calcul et améliorer la capacité du modèle. Les principales caractéristiques comprennent une tête de classification légère et une stratégie de sous-échantillonnage spatial-canal découplée pour préserver l'information plus efficacement. En supprimant l'étape NMS, YOLOv10 vise à simplifier le pipeline de déploiement et à réduire la latence, ce qui en fait un véritable détecteur "end-to-end".

Points forts

  • Efficacité améliorée : Affiche des performances impressionnantes en termes de compromis latence-précision et taille-précision, en particulier dans les environnements aux ressources limitées.
  • Conception sans NMS : L'élimination de l'étape de post-traitement NMS simplifie le déploiement et réduit le temps d'inférence de bout en bout.
  • Recherche de pointe : Représente une contribution académique importante à la détection d’objets en temps réel en s’attaquant aux goulots d’étranglement du post-traitement.

Faiblesses

  • Nouveau modèle : En tant que version récente d'une équipe de recherche universitaire, sa communauté est plus petite et il dispose de moins d'intégrations de tiers que l'écosystème Ultralytics bien établi.
  • Spécialisation de tâche : YOLOv10 est principalement axé sur la détection d’objets. Il ne possède pas la polyvalence intégrée pour d’autres tâches de vision telles que la segmentation, la classification et l’estimation de pose qui sont natives de YOLO11.
  • Intégration de l'écosystème : Bien que construit sur le framework Ultralytics, il peut nécessiter des efforts supplémentaires pour s'intégrer dans des flux de travail MLOps complets par rapport aux modèles développés et maintenus directement par Ultralytics.

Cas d'utilisation idéaux

YOLOv10 est particulièrement bien adapté aux applications où une faible latence et une efficacité de calcul sont les priorités absolues :

  • IA en périphérie (Edge AI) : Idéal pour le déploiement sur des appareils avec une puissance de calcul limitée, tels que les téléphones mobiles et les systèmes embarqués sur NVIDIA Jetson ou Raspberry Pi.
  • Traitement à haute vitesse : Convient aux applications nécessitant une inférence très rapide, telles que les drones autonomes et la robotique.
  • Analyse en temps réel : Parfait pour les environnements dynamiques nécessitant une détection d’objets immédiate, comme la gestion du trafic.

En savoir plus sur YOLOv10

Ultralytics YOLO11 : À la pointe de la polyvalence et de la performance

Auteurs : Glenn Jocher, Jing Qiu
Organisation : Ultralytics
Date : 2024-09-27
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 est la toute dernière évolution de la série YOLO d'Ultralytics, s'appuyant sur le succès de modèles très populaires comme YOLOv8. Il est conçu pour offrir une précision à la pointe de la technologie et un équilibre de performance supérieur, tout en étant incroyablement facile à utiliser et à intégrer. YOLO11 n'est pas seulement un détecteur d'objets, c'est un framework complet d'IA de vision.

Architecture et principales fonctionnalités

YOLO11 dispose d'une architecture hautement optimisée avec une extraction de caractéristiques avancée et une conception de réseau simplifiée. Il en résulte une plus grande précision, souvent avec un nombre de paramètres réduit par rapport à ses prédécesseurs. Un avantage clé de YOLO11 est sa polyvalence. Il prend en charge nativement un large éventail de tâches, notamment la détection d'objets, la segmentation d'instances, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB).

Cette polyvalence est soutenue par un écosystème bien maintenu. Ultralytics offre une expérience utilisateur rationalisée avec une simple API Python et une CLI, une documentation complète et une intégration transparente avec des outils tels que Ultralytics HUB pour l'entraînement et le déploiement sans code. Le modèle bénéficie de processus d'entraînement efficaces, de poids pré-entraînés facilement disponibles, d'un développement actif et d'un fort soutien de la communauté. De plus, les modèles YOLO11 sont conçus pour être efficaces, nécessitant moins de mémoire pendant l'entraînement et l'inférence par rapport à de nombreuses autres architectures, en particulier les modèles basés sur des transformateurs.

Points forts

  • Performances de pointe : Obtient d'excellents scores mAP avec un équilibre parfait entre vitesse et précision.
  • Polyvalent et multi-tâches : Un framework de modèle unique peut gérer la détection, la segmentation, la classification, la pose et l'OBB, offrant une flexibilité inégalée pour les projets complexes.
  • Facilité d'utilisation : Une API simple et intuitive, ainsi qu'une documentation complète, la rendent accessible aux débutants comme aux experts.
  • Écosystème robuste : Bénéficie d'un développement actif, de mises à jour fréquentes, d'un fort soutien de la communauté et d'une intégration transparente avec les outils MLOps tels que Ultralytics HUB.
  • Efficacité de l'entraînement et du déploiement : Offre des flux de travail d'entraînement efficaces, des besoins en mémoire réduits et est optimisé pour une large gamme de matériel, des appareils périphériques aux serveurs cloud.

Faiblesses

  • En tant que détecteur à une étape, il peut rencontrer des difficultés avec les objets extrêmement petits par rapport à certains détecteurs spécialisés à deux étapes.
  • Les modèles plus grands, bien que très précis, nécessitent d'importantes ressources de calcul pour l'entraînement et le déploiement.

Cas d'utilisation idéaux

La combinaison de hautes performances, de polyvalence et de facilité d'utilisation de YOLO11 en fait le choix idéal pour un large éventail d'applications concrètes :

  • Automatisation industrielle : Pour le contrôle qualité de haute précision et la surveillance des processus dans la fabrication.
  • Soins de santé : Dans l’analyse d’images médicales pour des tâches telles que la détection de tumeurs ou la segmentation cellulaire.
  • Sécurité et surveillance : Alimenter les systèmes de sécurité avancés avec la détection et le suivi des menaces en temps réel.
  • Analyse de vente au détail : Amélioration de la gestion des stocks et analyse du comportement des clients.
  • Projets multi-tâches : Parfait pour les applications qui nécessitent la détection d'objets, la segmentation et l'estimation de pose simultanées, comme les systèmes avancés d'aide à la conduite.

En savoir plus sur YOLO11

Comparaison directe des performances : YOLOv10 contre YOLO11

Lorsqu'on compare directement les modèles, on observe des compromis distincts. Les modèles YOLOv10, en particulier les variantes plus petites, sont conçus pour une efficacité extrême, ayant souvent moins de paramètres et de FLOPs. Cela en fait de bons candidats pour les tâches critiques en termes de latence.

Cependant, YOLO11 démontre un profil de performance plus robuste et équilibré. Il atteint un mAP légèrement supérieur pour la plupart des tailles de modèles et affiche des vitesses d'inférence nettement plus rapides sur CPU et GPU (T4 TensorRT). Cet équilibre supérieur entre vitesse et précision, combiné à ses capacités multitâches et à son écosystème mature, fait de YOLO11 un choix plus pratique et plus puissant pour la plupart des scénarios de développement et de déploiement.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusion : Quel modèle devriez-vous choisir ?

YOLOv10 et YOLO11 sont tous deux des modèles puissants qui repoussent les limites de la détection d'objets.

YOLOv10 est un excellent choix pour les chercheurs et les développeurs qui se concentrent sur les applications spécialisées et critiques en termes de latence, où l'architecture sans NMS offre un avantage distinct. Sa conception allégée la rend idéale pour un déploiement sur des appareils périphériques très contraints.

Cependant, pour la grande majorité des développeurs, des chercheurs et des applications commerciales, Ultralytics YOLO11 est le choix recommandé. Son léger avantage en termes de précision et sa vitesse d'inférence supérieure offrent un meilleur équilibre global des performances. Plus important encore, la polyvalence inégalée de YOLO11 dans de nombreuses tâches de vision, combinée à sa facilité d'utilisation et à l'écosystème Ultralytics robuste et bien entretenu, accélère considérablement le développement et simplifie le déploiement. La communauté active, la documentation complète et l'intégration transparente avec des outils tels que Ultralytics HUB font de YOLO11 non seulement un modèle, mais une solution complète pour la création d'applications d'IA de vision avancées.

Si vous explorez d'autres modèles, pensez à consulter les comparaisons entre YOLOv9 vs YOLO11 ou YOLOv8 vs YOLO11 pour comprendre l'évolution et trouver l'ajustement parfait pour votre projet.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires