Passer au contenu

EfficientDet vs YOLOv5 : Une comparaison technique détaillée

Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre le besoin de précision, de vitesse et de ressources de calcul. Cette page fournit une comparaison technique complète entre EfficientDet, une famille de modèles de Google connue pour son évolutivité et sa précision, et Ultralytics YOLOv5, un modèle largement adopté, célébré pour sa vitesse exceptionnelle et sa facilité d'utilisation. Nous allons approfondir leurs différences architecturales, leurs benchmarks de performance et leurs cas d'utilisation idéaux pour vous aider à sélectionner le meilleur modèle pour votre projet de vision par ordinateur.

EfficientDet : Architecture évolutive et efficace

EfficientDet a été introduit par l'équipe Google Brain en tant que nouvelle famille de détecteurs d'objets évolutifs et efficaces. Son innovation principale réside dans une architecture soigneusement conçue qui optimise à la fois la précision et l'efficacité grâce à une mise à l'échelle composée.

Détails techniques

Architecture et principales fonctionnalités

L'architecture d'EfficientDet repose sur trois composants clés :

  • Backbone EfficientNet : Il utilise le EfficientNet très efficace comme backbone pour l'extraction de caractéristiques, qui est déjà optimisé pour un excellent rapport précision/calcul.
  • BiFPN (Réseau de pyramide de caractéristiques bidirectionnel) : Pour la fusion de caractéristiques, EfficientDet introduit BiFPN, qui permet une fusion de caractéristiques multi-échelles simple et rapide. Contrairement aux FPN traditionnels, BiFPN possède des connexions bidirectionnelles et utilise la fusion de caractéristiques pondérée pour apprendre l’importance des différentes caractéristiques d’entrée.
  • Mise à l'échelle composite : Une nouvelle méthode de mise à l'échelle qui met à l'échelle uniformément la profondeur, la largeur et la résolution du backbone, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes. Cela permet de créer une famille de modèles (de D0 à D7) qui répondent à différentes contraintes de ressources tout en conservant la cohérence architecturale.

Points forts et faiblesses

Points forts :

  • Haute précision : Les modèles EfficientDet plus grands (par exemple, D5-D7) peuvent atteindre des scores mAP à la pointe de la technologie, surpassant souvent d'autres modèles dans les benchmarks de précision pure.
  • Efficacité des paramètres : Pour un niveau de précision donné, les modèles EfficientDet sont souvent plus efficaces en termes de paramètres et de FLOPs que les anciennes architectures comme Mask R-CNN.
  • Scalabilité : La méthode de mise à l'échelle composite offre une voie claire pour augmenter ou réduire la taille du modèle en fonction du matériel cible et des exigences de performance.

Faiblesses :

  • Vitesse d'inférence : Bien qu'il soit efficace pour sa précision, EfficientDet est généralement plus lent que les détecteurs à étape unique comme YOLOv5, en particulier sur GPU. Cela peut le rendre moins adapté aux applications d'inférence en temps réel.
  • Complexité : La BiFPN et la mise à l'échelle composite introduisent un niveau de complexité architecturale plus élevé que la conception plus simple de YOLOv5.

Cas d'utilisation idéaux

EfficientDet est un excellent choix pour les applications où l'obtention de la plus haute précision possible est l'objectif principal, et où la latence est une préoccupation secondaire :

  • Analyse d’images médicales : Détection d’anomalies subtiles dans les analyses médicales où la précision est primordiale.
  • Imagerie satellite: Analyse à haute résolution pour des applications telles que l'agriculture ou la surveillance environnementale.
  • Traitement hors ligne par lots : Analyse de grands ensembles de données d’images ou de vidéos où le traitement n’a pas besoin d’avoir lieu en temps réel.

En savoir plus sur EfficientDet

Ultralytics YOLOv5 : le modèle polyvalent et largement adopté

Ultralytics YOLOv5 est devenu une norme de l’industrie, réputée pour son incroyable équilibre entre vitesse, précision et facilité d’utilisation inégalée. Développé en PyTorch, il est un modèle de référence pour les développeurs et les chercheurs à la recherche d’une solution pratique et performante.

Détails techniques

Points forts et faiblesses

Points forts :

  • Vitesse exceptionnelle : YOLOv5 est exceptionnellement rapide, permettant une détection d'objets en temps réel essentielle pour les applications telles que les systèmes d'alarme de sécurité.
  • Facilité d'utilisation : Il offre un flux de travail simple pour l'entraînement et le déploiement, soutenu par une excellente documentation Ultralytics et une expérience utilisateur simplifiée via des interfaces Python et CLI simples.
  • Écosystème bien maintenu : YOLOv5 bénéficie d'un développement actif, d'une large communauté, de mises à jour fréquentes et de nombreuses ressources telles que des tutoriels et des intégrations avec des outils tels que Ultralytics HUB pour l'entraînement sans code.
  • Équilibre des performances : Le modèle offre un bon compromis entre la vitesse d’inférence et la précision de la détection, ce qui le rend adapté à un large éventail de scénarios réels.
  • Efficacité de l'entraînement : YOLOv5 se caractérise par un processus d'entraînement efficace avec des poids pré-entraînés facilement disponibles et nécessite généralement moins de mémoire pour l'entraînement et l'inférence par rapport aux architectures plus complexes.
  • Polyvalence : Au-delà de la détection d’objets, YOLOv5 prend également en charge les tâches de segmentation d’instance et de classification d’images.

Faiblesses :

  • Précision : Bien que très précis, YOLOv5 n’atteint pas toujours le mAP le plus élevé par rapport aux plus grands modèles EfficientDet, en particulier pour la détection de très petits objets.
  • Détection basée sur les ancres : Elle repose sur des boîtes d'ancrage prédéfinies, ce qui peut nécessiter un réglage pour des performances optimales sur les ensembles de données avec des rapports d'aspect d'objet inhabituels.

Cas d'utilisation idéaux

YOLOv5 est le choix préféré pour les applications où la vitesse, l'efficacité et la facilité de déploiement sont primordiales :

  • Vidéosurveillance en temps réel : Détection rapide d'objets dans les flux vidéo en direct.
  • Systèmes autonomes : Perception à faible latence pour la robotique et les véhicules autonomes.
  • Edge Computing : Déploiement sur des appareils aux ressources limitées comme Raspberry Pi et NVIDIA Jetson en raison de l’efficacité du modèle.
  • Applications mobiles : Des temps d’inférence rapides et des tailles de modèle plus petites conviennent aux plateformes mobiles.

En savoir plus sur YOLOv5

Analyse des performances : Précision vs. Vitesse

Le principal compromis entre EfficientDet et YOLOv5 réside dans la précision par rapport à la vitesse. Le tableau ci-dessous montre que, bien que les modèles EfficientDet plus grands puissent atteindre des scores mAP plus élevés, ils le font avec une latence significativement plus élevée. En revanche, les modèles YOLOv5 offrent des vitesses d'inférence beaucoup plus rapides, en particulier sur GPU (T4 TensorRT), ce qui les rend idéaux pour les applications en temps réel. Par exemple, YOLOv5l atteint un mAP compétitif de 49,0 avec une latence de seulement 6,61 ms, alors que l'EfficientDet-d4, d'une précision similaire, est plus de 5 fois plus lent à 33,55 ms.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusion : Quel modèle devriez-vous choisir ?

EfficientDet et Ultralytics YOLOv5 sont tous deux des modèles de détection d'objets puissants, mais ils répondent à des priorités différentes. EfficientDet excelle lorsque la précision maximale est l'objectif principal, potentiellement au détriment de la vitesse d'inférence.

Ultralytics YOLOv5, cependant, se distingue par son équilibre exceptionnel entre vitesse et précision, ce qui le rend idéal pour la grande majorité des applications du monde réel. Sa Facilité d'utilisation, son écosystème complet et bien maintenu (y compris Ultralytics HUB), son entraînement efficace et sa scalabilité en font un choix très pratique et convivial. Pour les projets nécessitant un déploiement rapide, des performances en temps réel et un fort soutien communautaire, YOLOv5 est souvent l'option supérieure.

Les utilisateurs intéressés par l'exploration de modèles plus récents avec d'autres avancées pourraient également envisager Ultralytics YOLOv8 ou le dernier YOLO11, qui s'appuient sur les forces de YOLOv5 avec une précision améliorée et de nouvelles fonctionnalités. Pour plus de comparaisons, consultez la page de comparaison des modèles Ultralytics.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires