Passer au contenu

EfficientDet contre. YOLOv9 : une comparaison technique

Choisir le modèle de détection d'objets optimal est essentiel pour les tâches de vision par ordinateur, en équilibrant la précision, la vitesse et les ressources de calcul. Cette page fournit une comparaison technique détaillée entre EfficientDet de Google et Ultralytics YOLOv9, deux modèles importants dans le paysage de la détection d'objets. Nous examinerons en profondeur leurs conceptions architecturales, leurs benchmarks de performance et leurs applications appropriées pour vous aider à prendre une décision éclairée pour vos projets.

EfficientDet : Architecture évolutive et efficace

EfficientDet a été introduit en 2019 par des chercheurs de Google Research et est rapidement devenu une référence en matière de détection d'objets efficace. Il a proposé une famille de modèles capables de s'adapter des versions légères compatibles avec la périphérie aux versions basées sur le nuage, très précises, en utilisant une méthode de mise à l'échelle composée systématique.

Architecture et principales fonctionnalités

L'architecture d'EfficientDet repose sur trois composants clés :

  • Backbone EfficientNet : Il utilise le EfficientNet très efficace comme backbone pour l'extraction de caractéristiques, qui a été conçu à l'aide d'une recherche d'architecture neurale (NAS) pour optimiser à la fois la précision et les FLOPs.
  • BiFPN (Réseau de pyramide de caractéristiques bidirectionnel) : Au lieu d’un FPN traditionnel, EfficientDet utilise BiFPN, qui permet une fusion de caractéristiques multi-échelles plus riche avec des connexions pondérées, améliorant ainsi la précision avec une surcharge de calcul minimale.
  • Mise à l'échelle composite : Une nouvelle méthode qui met à l'échelle uniformément la profondeur, la largeur et la résolution du backbone, du réseau de caractéristiques et de la tête de détection. Cela permet de créer une famille de modèles (D0 à D7) qui répondent à différentes contraintes de ressources.

Points forts

  • Scalabilité : Le principal atout d'EfficientDet est sa famille de modèles, qui offre un large éventail d'options pour différentes cibles de déploiement, des appareils mobiles aux centres de données.
  • Efficacité pionnière : Au moment de sa sortie, il a établi une nouvelle norme en matière d'efficacité, atteignant une haute précision avec moins de paramètres et de FLOPs que les modèles concurrents.

Faiblesses

  • Âge et performance : Bien que fondamentale, l'architecture date de 2019. Les modèles plus récents comme YOLOv9 l'ont surpassée en termes de vitesse et de précision, en particulier sur du matériel moderne comme les GPU.
  • Vitesse d'inférence : Les modèles EfficientDet plus grands peuvent être lents, en particulier par rapport aux vitesses d'inférence hautement optimisées des modèles YOLO.
  • Spécificité de la tâche : EfficientDet est conçu uniquement pour la détection d’objets, ne possédant pas la polyvalence intégrée pour d’autres tâches telles que la segmentation d’instance ou l’estimation de pose que l’on trouve dans les cadres modernes.
  • Écosystème : Le référentiel officiel est moins axé sur l'expérience utilisateur et n'est pas aussi activement maintenu ou pris en charge que l'écosystème Ultralytics complet.

Cas d'utilisation

EfficientDet reste une option viable pour :

  • Applications où un compromis spécifique offert par l'une de ses variantes à l'échelle (D0-D7) est parfaitement adapté.
  • Projets qui nécessitent un déploiement sur les CPU, où ses modèles plus petits affichent des performances compétitives.
  • Systèmes existants où le modèle est déjà intégré et fonctionne de manière adéquate.

En savoir plus sur EfficientDet

YOLOv9 : Précision et efficacité de pointe

Ultralytics YOLOv9, introduit en 2024 par Chien-Yao Wang et Hong-Yuan Mark Liao, représente une avancée significative dans la détection d'objets en temps réel. Il s'attaque au défi de la perte d'informations dans les réseaux profonds grâce à des éléments architecturaux innovants, établissant de nouvelles références en matière de pointe.

Architecture et principales fonctionnalités

La performance supérieure de YOLOv9 découle de deux innovations principales :

  • Informations de gradient programmables (PGI) : Ce concept est conçu pour s'attaquer au problème du goulot d'étranglement de l'information dans les réseaux neuronaux profonds. PGI génère des gradients fiables pour garantir que le modèle peut apprendre des informations complètes, ce qui conduit à des représentations de caractéristiques plus précises.
  • Generalized Efficient Layer Aggregation Network (GELAN) : YOLOv9 introduit GELAN, une architecture nouvelle et très efficace qui s'appuie sur les principes de CSPNet et ELAN. Il optimise l'utilisation des paramètres et l'efficacité computationnelle, permettant au modèle d'atteindre une plus grande précision avec moins de ressources.

Points forts

  • Précision à la pointe de la technologie : YOLOv9 offre une précision supérieure dans la détection d'objets, surpassant des concurrents tels que EfficientDet avec un nombre de paramètres similaire ou inférieur, comme indiqué dans son article "YOLOv9 : Apprendre ce que vous voulez apprendre en utilisant l'information de gradient programmable".
  • Équilibre exceptionnel des performances : Il offre un compromis exceptionnel entre la précision, la vitesse d'inférence et la taille du modèle, le rendant adapté à un large éventail d'applications, de l'IA en périphérie aux serveurs cloud haute performance.
  • Facilité d'utilisation : Lorsqu'il est utilisé dans le framework Ultralytics, YOLOv9 bénéficie d'une expérience utilisateur simplifiée, d'une API Python simple et d'une documentation exhaustive.
  • Écosystème bien maintenu : L'écosystème Ultralytics offre un développement actif, une communauté large et offrant un bon soutien, des mises à jour fréquentes et une intégration avec des outils tels que Ultralytics HUB pour l'entraînement sans code et le MLOps.
  • Efficacité de l'entraînement : Les modèles YOLO ont généralement des besoins en mémoire inférieurs pendant l'entraînement par rapport à d'autres architectures. Le framework offre des processus d'entraînement efficaces et des poids pré-entraînés facilement disponibles.
  • Polyvalence : Bien que l'article original se concentre sur la détection, l'architecture GELAN sous-jacente est polyvalente. Le référentiel original laisse entrevoir la prise en charge de tâches telles que la segmentation d'instance et la segmentation panoptique, s'alignant sur les capacités multitâches d'autres modèles Ultralytics comme YOLOv8.

Faiblesses

  • Nouveauté : En tant que modèle plus récent, les exemples de déploiement dans le monde réel peuvent être moins nombreux que pour les modèles plus anciens et établis comme EfficientDet, bien que l’adoption au sein de la communauté Ultralytics soit rapide.
  • Ressources d'entraînement : Bien qu'il soit efficace sur le plan du calcul pour son niveau de performance, l'entraînement des plus grandes variantes de YOLOv9 (par exemple, YOLOv9-E) peut toujours nécessiter d'importantes ressources de calcul.

Cas d'utilisation

YOLOv9 est particulièrement bien adapté aux applications où la précision et l’efficacité sont primordiales, telles que :

En savoir plus sur YOLOv9

Analyse des performances : YOLOv9 vs. EfficientDet

Le tableau suivant fournit une comparaison directe des mesures de performance pour différentes tailles de modèles d'EfficientDet et YOLOv9, évaluées sur le jeu de données COCO.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

D'après les données, plusieurs informations clés émergent :

  • Précision et efficacité : YOLOv9 offre constamment un meilleur compromis. Par exemple, YOLOv9-C atteint un mAP plus élevé (53,0) que EfficientDet-D6 (52,6) avec environ la moitié des paramètres et des FLOPs.
  • Vitesse d'inférence : Sur un GPU moderne avec optimisation TensorRT, les modèles YOLOv9 sont considérablement plus rapides. YOLOv9-E est plus de 7 fois plus rapide qu'EfficientDet-D7 tout en étant plus précis. Même le plus petit modèle YOLOv9t est beaucoup plus rapide que le plus petit EfficientDet-d0.
  • Utilisation des ressources : Les modèles YOLOv9 sont plus efficaces en termes de paramètres. YOLOv9-S (7,1 M de paramètres) surpasse la précision d’EfficientDet-D3 (12,0 M de paramètres). Cette efficacité est essentielle pour le déploiement sur des appareils aux ressources limitées.

Conclusion et recommandations

Bien qu'EfficientDet ait été un modèle révolutionnaire qui a repoussé les limites de l'efficacité, le domaine de la vision par ordinateur a progressé rapidement. Pour les nouveaux projets démarrant aujourd'hui, YOLOv9 est le choix évident. Il offre une précision de pointe, une vitesse d'inférence supérieure sur le matériel moderne et une plus grande efficacité de calcul.

L'intégration de YOLOv9 dans l'écosystème Ultralytics consolide davantage son avantage, offrant aux développeurs un cadre convivial, bien pris en charge et polyvalent qui accélère l'ensemble du flux de travail, de l'entraînement au déploiement. EfficientDet reste un modèle historiquement important et peut être approprié pour la maintenance des systèmes existants, mais pour les nouvelles applications hautes performances, YOLOv9 offre un avantage décisif.

Explorer d'autres modèles

Si vous explorez différents modèles de pointe, assurez-vous de consulter nos autres pages de comparaison :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires