Passer au contenu

DAMO-YOLO vs YOLOv5 : Une comparaison technique détaillée

Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre la précision, la vitesse et la facilité de mise en œuvre. Cette page fournit une comparaison technique détaillée entre DAMO-YOLO, un modèle axé sur la précision du groupe Alibaba, et Ultralytics YOLOv5, un modèle standard de l'industrie réputé pour son mélange exceptionnel de performances et de convivialité. Nous examinerons en profondeur leurs différences architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à sélectionner le meilleur modèle pour votre projet de vision par ordinateur.

DAMO-YOLO : Détection axée sur la précision

Auteurs : Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang et Xiuyu Sun
Organisation : Alibaba Group
Date : 2022-11-23
Arxiv : https://arxiv.org/abs/2211.15444v2
GitHub : https://github.com/tinyvision/DAMO-YOLO
Documentation : https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO est un modèle de détection d'objets développé par Alibaba Group. Introduit fin 2022, il se concentre sur l'obtention d'un équilibre supérieur entre une haute précision et une inférence efficace en incorporant plusieurs nouvelles techniques dans son architecture.

Architecture et principales fonctionnalités

DAMO-YOLO introduit plusieurs composants innovants conçus pour repousser les limites de la précision de la détection :

  • Backbones NAS : Il utilise la recherche d’architecture neuronale (NAS) pour découvrir et implémenter des réseaux de backbone très efficaces, adaptés à la détection d’objets.
  • RepGFPN efficace : Le modèle utilise un réseau de pyramide de caractéristiques de gradient reparamétré, un module de neck avancé pour une meilleure fusion des caractéristiques à différentes échelles.
  • ZeroHead : Elle est dotée d’une tête de détection découplée conçue pour minimiser la surcharge de calcul tout en maintenant des performances élevées.
  • AlignedOTA : Cette nouvelle stratégie d'attribution de labels, Aligned Optimal Transport Assignment, garantit un meilleur alignement entre les prédictions et les labels de vérité terrain pendant l'entraînement, ce qui permet d'améliorer la précision.
  • Amélioration par distillation : Le modèle exploite la distillation des connaissances pour transférer les connaissances d'un modèle enseignant plus grand et plus puissant vers le modèle étudiant plus petit, améliorant ainsi ses performances.

Points forts

  • Haute précision : DAMO-YOLO obtient de solides scores mAP, ce qui indique une excellente précision de détection, en particulier avec ses variantes de modèles plus grands.
  • Techniques innovantes : L'intégration de méthodes novatrices telles qu'AlignedOTA et RepGFPN lui permet d'améliorer les performances au-delà des architectures plus standard.

Faiblesses

  • Complexité de l’intégration : L’intégration de DAMO-YOLO dans les flux de travail existants peut être plus complexe, surtout comparativement à l’expérience simplifiée offerte au sein de l’écosystème Ultralytics.
  • Support de l'écosystème : Sa documentation et son support communautaire, bien que disponibles, peuvent être moins complets que ceux de YOLOv5, qui est bien établi et activement maintenu.
  • Polyvalence des tâches : DAMO-YOLO se concentre principalement sur la détection d’objets, et pourrait ne pas prendre en charge d’autres tâches telles que la segmentation ou la classification, contrairement aux modèles Ultralytics.

Cas d'utilisation

DAMO-YOLO est bien adapté aux applications où une haute précision de détection est l'exigence principale :

  • Applications de haute précision : Analyse d'images détaillée, comme dans l'imagerie médicale et la recherche scientifique.
  • Scénarios complexes : Environnements avec des objets fortement occlus ou ceux nécessitant une compréhension approfondie de la scène.
  • Recherche et développement : Un outil précieux pour les chercheurs qui explorent les architectures et les techniques avancées de détection d'objets.

En savoir plus sur DAMO-YOLO

Ultralytics YOLOv5 : la norme industrielle établie

Auteur : Glenn Jocher
Organisation : Ultralytics
Date : 2020-06-26
GitHub : https://github.com/ultralytics/yolov5
Documentation : https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 est rapidement devenu une référence dans l'industrie après sa sortie, salué pour son équilibre exceptionnel entre vitesse, précision et sa remarquable facilité d'utilisation. Développé entièrement en PyTorch, YOLOv5 dispose d'une architecture robuste qui combine un backbone CSPDarknet53 avec un "neck" PANet pour une agrégation efficace des caractéristiques. Sa scalabilité, offerte à travers différentes tailles de modèles (n, s, m, l, x), permet aux développeurs de sélectionner le compromis parfait pour leurs besoins spécifiques en matière de calcul et de performance.

Points forts

  • Vitesse et efficacité exceptionnelles : YOLOv5 est hautement optimisé pour une inférence rapide, ce qui en fait un choix de premier ordre pour les applications en temps réel sur une large gamme de matériels, des GPU cloud puissants aux appareils périphériques aux ressources limitées.
  • Facilité d’utilisation : Un avantage clé de YOLOv5 est son expérience utilisateur simplifiée. Il offre des interfaces Python et CLI simples, une documentation complète et un processus de configuration simple.
  • Écosystème bien maintenu : YOLOv5 est pris en charge par l'écosystème robuste d'Ultralytics, qui comprend un développement actif, une communauté large et utile, des mises à jour fréquentes et une intégration transparente avec des outils tels que Ultralytics HUB pour l'entraînement sans code et le MLOps.
  • Équilibre des performances : Il permet un excellent compromis entre la vitesse d’inférence et la précision de la détection, ce qui le rend très pratique pour divers scénarios de déploiement dans le monde réel.
  • Polyvalence : Au-delà de la détection d’objets, YOLOv5 prend en charge la segmentation d’instance et la classification d’images, offrant une solution polyvalente.
  • Efficacité de l'entraînement : YOLOv5 offre des processus d'entraînement efficaces, des poids pré-entraînés facilement disponibles et nécessite généralement moins de mémoire que de nombreuses architectures concurrentes.

Faiblesses

  • Précision : Bien que très précis, les modèles plus récents ont depuis dépassé les scores mAP de YOLOv5 sur des bancs d’essai standard comme COCO.
  • Basée sur des ancres : Sa dépendance à des boîtes d’ancrage prédéfinies peut nécessiter un réglage supplémentaire pour les ensembles de données avec des rapports d’aspect d’objet non conventionnels par rapport aux approches sans ancres.

Cas d'utilisation

YOLOv5 excelle dans les scénarios où la vitesse, l’efficacité et la facilité de déploiement sont essentielles :

  • Systèmes de sécurité : Surveillance en temps réel pour des applications telles que la prévention du vol et la détection d'anomalies.
  • Robotique : Permet aux robots de percevoir et d'interagir avec leur environnement en temps réel, ce qui est crucial pour la navigation et la manipulation autonomes.
  • Automatisation industrielle : Contrôle qualité et détection des défauts dans les processus de fabrication, améliorant l'efficacité du recyclage et la surveillance des lignes de production.
  • Déploiement d'IA en périphérie (Edge AI) : Exécution efficace de la détection d'objets sur des appareils aux ressources limitées tels que Raspberry Pi et NVIDIA Jetson pour le traitement sur l'appareil.

En savoir plus sur YOLOv5

Comparaison des performances

Lors de la comparaison de DAMO-YOLO et YOLOv5, un compromis clair émerge entre la précision et la vitesse. Les modèles DAMO-YOLO obtiennent généralement des scores mAP plus élevés, ce qui démontre leur force en matière de précision de détection pure. Cependant, les modèles YOLOv5, en particulier les variantes plus petites, offrent des vitesses d'inférence nettement plus rapides, en particulier sur le matériel CPU. Cela fait de YOLOv5 un choix plus pratique pour les applications en temps réel où une faible latence est essentielle.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusion

DAMO-YOLO et Ultralytics YOLOv5 sont tous deux des modèles de détection d'objets puissants, mais ils répondent à des priorités différentes. DAMO-YOLO est un excellent choix pour les applications où l'obtention de la plus grande précision possible est l'objectif principal, et où les développeurs sont prêts à gérer une intégration plus complexe.

Cependant, pour la grande majorité des développeurs et des applications du monde réel, Ultralytics YOLOv5 présente une solution plus convaincante et pratique. Son équilibre exceptionnel entre vitesse et précision, combiné à son Ease of Use inégalé, le rend incroyablement accessible. Le Well-Maintained Ecosystem offre un avantage significatif, offrant une documentation robuste, un support communautaire actif et des outils puissants comme Ultralytics HUB. L'Training Efficiency et la Versatility de YOLOv5 dans de multiples tâches de vision en font un choix très efficace et convivial pour les développeurs pour des projets allant du prototypage rapide au déploiement en production.

Pour ceux qui s'intéressent aux dernières avancées, les nouveaux modèles Ultralytics comme YOLOv8 et YOLO11 s'appuient sur les forces de YOLOv5, offrant des performances encore meilleures et plus de fonctionnalités.

Autres comparaisons de modèles

Pour une exploration plus approfondie, considérez ces comparaisons impliquant DAMO-YOLO, YOLOv5 et d'autres modèles pertinents :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires