Passer au contenu

YOLOv10 vs. DAMO-YOLO : Une comparaison technique

La sélection du modèle de détection d'objets optimal est une décision essentielle qui équilibre les compromis entre la précision, la vitesse et le coût de calcul. Cette page fournit une comparaison technique détaillée entre YOLOv10, le dernier modèle hautement efficace intégré à l'écosystème Ultralytics, et DAMO-YOLO, un détecteur puissant d'Alibaba Group. Nous analyserons leurs architectures, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à faire un choix éclairé pour vos projets de vision par ordinateur.

YOLOv10 : Détection en temps réel de bout en bout

YOLOv10, introduit par des chercheurs de l'Université de Tsinghua en mai 2024, marque une avancée significative dans la détection d'objets en temps réel. Son innovation principale est de réaliser une détection de bout en bout en éliminant le besoin de Suppression Non Maximale (NMS), ce qui réduit la surcharge de post-traitement et diminue la latence d'inférence.

Détails techniques :

Architecture et principales fonctionnalités

YOLOv10 s'appuie sur le framework Ultralytics robuste, héritant de sa facilité d'utilisation et de son écosystème puissant. Son architecture introduit plusieurs avancées clés pour une efficacité et des performances supérieures :

  • Formation sans NMS : YOLOv10 utilise des affectations doubles cohérentes pour les étiquettes pendant la formation. Cela permet au modèle de produire des prédictions propres sans nécessiter l’étape de post-traitement NMS, simplifiant ainsi le pipeline de déploiement et le rendant véritablement de bout en bout.
  • Conception holistique axée sur l’efficacité et la précision : L’architecture du modèle a été optimisée de manière exhaustive afin de réduire la redondance de calcul. Cela comprend une tête de classification légère et un sous-échantillonnage spatial-canal découplé, ce qui améliore à la fois la vitesse et les capacités.
  • Intégration transparente à Ultralytics : En tant que partie intégrante de l’écosystème Ultralytics, YOLOv10 bénéficie d’une expérience utilisateur simplifiée. Cela comprend une API Python simple, une documentation exhaustive, des processus de formation efficaces et des poids pré-entraînés facilement disponibles. Cette intégration permet aux développeurs de démarrer et de déployer des modèles exceptionnellement facilement.

Points forts et faiblesses

Points forts :

  • Efficacité à la pointe de la technologie : YOLOv10 offre un équilibre exceptionnel entre vitesse et précision, surpassant souvent ses concurrents avec moins de paramètres et une latence plus faible, comme détaillé dans le tableau de performance ci-dessous.
  • Facilité d'utilisation : Le modèle est incroyablement convivial grâce à son intégration avec l'écosystème Ultralytics, qui comprend Ultralytics HUB pour la formation et le déploiement sans code.
  • Déploiement de bout en bout : La conception sans NMS simplifie l'ensemble du flux de travail, de la formation à l'inférence, ce qui le rend idéal pour les applications du monde réel.
  • Besoins en mémoire inférieurs : par rapport aux architectures plus complexes, YOLOv10 est efficace dans son utilisation de la mémoire pendant l’entraînement et l’inférence, ce qui le rend accessible aux utilisateurs disposant de matériel limité.

Faiblesses :

  • Spécialisation de tâche : Bien qu’il soit exceptionnel pour la détection d’objets, YOLOv10 est actuellement axé sur cette tâche unique, contrairement au polyvalent Ultralytics YOLOv8 qui prend en charge la segmentation, la classification et l’estimation de pose prêtes à l’emploi.

Cas d'utilisation idéaux

YOLOv10 est le choix idéal pour les applications où les performances et l'efficacité en temps réel sont primordiales :

  • IA en périphérie (Edge AI) : Son faible encombrement et sa faible latence le rendent idéal pour le déploiement sur des appareils aux ressources limitées tels que le NVIDIA Jetson ou Raspberry Pi.
  • Systèmes autonomes : Une détection rapide et fiable est cruciale pour les applications telles que les voitures autonomes et la robotique.
  • Analyse vidéo en temps réel : Parfait pour les systèmes à haut débit tels que la gestion du trafic et la surveillance de sécurité.

En savoir plus sur YOLOv10

DAMO-YOLO

DAMO-YOLO est un modèle de détection d'objets rapide et précis développé par Alibaba Group. Lancé en novembre 2022, il a introduit plusieurs nouvelles techniques pour repousser les limites de performance des détecteurs de type YOLO.

Détails techniques :

Architecture et principales fonctionnalités

DAMO-YOLO est le résultat de l'exploration de techniques avancées pour améliorer le compromis vitesse-précision. Son architecture est caractérisée par :

  • Neural Architecture Search (NAS) : La colonne vertébrale de DAMO-YOLO a été générée à l’aide de NAS, ce qui permet d’obtenir un extracteur de caractéristiques hautement optimisé.
  • Neck RepGFPN efficace : Il intègre une nouvelle conception de réseau de pyramide de caractéristiques (FPN) à la fois efficace et puissante.
  • ZeroHead et AlignedOTA : Le modèle utilise une tête simplifiée, sans paramètre, et une stratégie d'attribution d'étiquettes améliorée (AlignedOTA) pour améliorer la précision de la détection.
  • Distillation des connaissances : DAMO-YOLO exploite la distillation pour améliorer davantage la performance de ses plus petits modèles.

Points forts et faiblesses

Points forts :

  • Hautes performances : DAMO-YOLO offre une précision et une vitesse compétitives, ce qui en fait un concurrent sérieux dans le domaine de la détection d’objets.
  • Technologies innovantes : Elle intègre des concepts de recherche de pointe tels que NAS et des stratégies avancées d'attribution d'étiquettes.

Faiblesses :

  • Complexité supérieure : L'architecture du modèle et le pipeline d'entraînement sont plus complexes que ceux de YOLOv10, ce qui pourrait créer une courbe d'apprentissage plus abrupte pour les utilisateurs.
  • Limites de l'écosystème : DAMO-YOLO est principalement disponible dans la boîte à outils MMDetection. Cela peut constituer un obstacle pour les développeurs qui ne connaissent pas cet écosystème et qui préfèrent une solution plus intégrée et conviviale comme celle proposée par Ultralytics.
  • Communauté et support : Bien qu'il s'agisse d'une contribution importante, il se peut qu'il n'ait pas le même niveau de support communautaire actif, de mises à jour fréquentes et de ressources étendues que les modèles de l'écosystème Ultralytics.

Cas d'utilisation idéaux

DAMO-YOLO est bien adapté aux chercheurs et aux développeurs qui :

  • Privilégier les architectures novatrices : Pour ceux qui souhaitent explorer les dernières tendances de la recherche, comme les backbones alimentés par NAS.
  • Travailler au sein de MMDetection : Les utilisateurs déjà à l'aise avec le framework MMDetection peuvent intégrer DAMO-YOLO dans leurs flux de travail.
  • Nécessite une grande précision : Dans les scénarios où il est essentiel d'extraire le dernier bit de précision et où la complexité supplémentaire est gérable.

En savoir plus sur DAMO-YOLO

Comparaison directe des performances : YOLOv10 contre DAMO-YOLO

Le tableau suivant compare les performances de différentes tailles de modèles YOLOv10 et DAMO-YOLO sur le jeu de données COCO. YOLOv10 démontre constamment des performances supérieures, offrant une plus grande précision avec une latence plus faible et moins de paramètres.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Comme le montrent les données, les modèles YOLOv10 surpassent constamment leurs homologues DAMO-YOLO. Par exemple, YOLOv10-S atteint un mAP plus élevé (46,7 contre 46,0) que DAMO-YOLO-S tout en étant significativement plus rapide (2,66 ms contre 3,45 ms) et en ayant moins de la moitié des paramètres (7,2M contre 16,3M). Cette tendance se maintient pour toutes les tailles de modèles, culminant avec YOLOv10-X atteignant le mAP le plus élevé de 54,4.

Conclusion

YOLOv10 et DAMO-YOLO sont tous deux des modèles de détection d'objets impressionnants, mais ils répondent à des besoins différents. DAMO-YOLO est un modèle de recherche solide qui met en valeur des idées architecturales innovantes.

Cependant, pour la grande majorité des développeurs, des chercheurs et des entreprises, YOLOv10 est le choix évident. Ses performances supérieures, combinées à sa conception sans NMS, le rendent plus rapide et plus efficace pour un déploiement dans le monde réel. Plus important encore, son intégration transparente dans l'écosystème Ultralytics offre une expérience utilisateur inégalée grâce à une documentation complète, un soutien communautaire actif et une suite d'outils tels que Ultralytics HUB qui simplifient l'ensemble du cycle de vie MLOps.

Pour ceux qui recherchent d'autres options à la pointe de la technologie, il est également intéressant d'explorer Ultralytics YOLOv8 pour sa polyvalence dans de multiples tâches de vision ou de consulter nos autres comparaisons de modèles afin de trouver la solution idéale pour votre projet.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires