Passer au contenu

EfficientDet contre. YOLOv10 : une comparaison technique

La sélection du modèle de détection d'objets optimal est une décision essentielle qui équilibre la précision, la vitesse d'inférence et le coût de calcul. Cette page fournit une comparaison technique détaillée entre EfficientDet et YOLOv10, deux modèles influents dans le domaine de la vision par ordinateur. Nous analyserons leurs architectures, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à choisir le meilleur modèle pour votre projet, en mettant un accent particulier sur les avantages offerts par YOLOv10 au sein de l'écosystème Ultralytics.

EfficientDet : Architecture évolutive et efficace

EfficientDet a été introduit par l'équipe Google Brain en tant que famille de détecteurs d'objets hautement efficaces et évolutifs. Son innovation principale a été une approche systématique de la mise à l'échelle des modèles, visant à optimiser à la fois la précision et l'efficacité dans un large éventail de budgets de calcul.

Détails techniques :

Architecture et principales fonctionnalités

L'architecture d'EfficientDet repose sur trois composants clés :

  • Backbone EfficientNet : Il utilise le EfficientNet très efficace comme backbone pour l'extraction de caractéristiques, qui a lui-même été conçu à l'aide d'une recherche d'architecture neurale.
  • BiFPN (Réseau de pyramide de caractéristiques bidirectionnel) : Un nouveau réseau de caractéristiques qui permet une fusion de caractéristiques multi-échelles facile et rapide. Contrairement aux FPN traditionnels, BiFPN possède des connexions inter-échelles bidirectionnelles et utilise la fusion de caractéristiques pondérée pour apprendre l’importance des différentes caractéristiques d’entrée.
  • Scaling composite : Une méthode de scaling unique qui met à l’échelle uniformément la profondeur, la largeur et la résolution du backbone, du réseau de caractéristiques et de la tête de prédiction simultanément à l’aide d’un simple coefficient composite. Ceci garantit une architecture équilibrée et optimisée à n’importe quelle échelle.

Points forts et faiblesses

Points forts :

  • Excellente évolutivité : La méthode de mise à l’échelle composite offre une voie claire pour augmenter ou réduire l’échelle du modèle (de EfficientDet-D0 à D7) afin de répondre aux différentes contraintes de ressources.
  • Efficacité des paramètres et des FLOPs : Au moment de sa sortie, il a établi de nouvelles normes en matière d’efficacité, atteignant une grande précision avec moins de paramètres et de FLOPs que les détecteurs précédents.

Faiblesses :

  • Âge et performance : Bien que fondamentale, l'architecture date de plusieurs années. Les modèles plus récents comme YOLOv10 l'ont surpassée en termes de vitesse et de compromis précision-efficacité, en particulier sur du matériel moderne comme les GPU.
  • Écosystème et maintenance : Le référentiel d'origine n'est pas aussi activement maintenu que les alternatives plus récentes. Il lui manque l'écosystème complet, la documentation exhaustive et le support communautaire que l'on trouve avec les modèles Ultralytics.
  • Polyvalence des tâches : EfficientDet est conçu spécifiquement pour la détection d’objets et ne prend pas en charge nativement d’autres tâches telles que la segmentation d’instance ou l’estimation de pose.

Cas d'utilisation idéaux

EfficientDet reste un modèle pertinent pour les scénarios où les FLOPs et le nombre de paramètres sont les contraintes primaires absolues.

  • Matériel aux ressources limitées : Ses variantes plus petites conviennent au déploiement sur des appareils dont la puissance de calcul est limitée, où chaque FLOP compte.
  • Évaluation comparative académique : Il constitue une base de référence solide pour la recherche sur l'efficacité des modèles et la conception architecturale.

En savoir plus sur EfficientDet

YOLOv10 : Détection en temps réel de bout en bout

Ultralytics YOLOv10 est un détecteur d'objets en temps réel de pointe de l'université de Tsinghua. Il repousse les limites de la performance en introduisant des innovations architecturales qui réduisent la redondance de calcul et éliminent le besoin de suppression non maximale (NMS), permettant une véritable détection de bout en bout.

Détails techniques :

Architecture et principales fonctionnalités

La conception de YOLOv10 est axée sur l'efficacité et la précision holistiques.

  • Formation sans NMS : Elle utilise des affectations doubles cohérentes pour les étiquettes pendant la formation, ce qui lui permet d’obtenir des performances compétitives sans nécessiter de NMS pendant le post-traitement. Cela réduit considérablement la latence d’inférence et simplifie le déploiement.
  • Conception holistique axée sur l’efficacité et la précision : L’architecture du modèle est optimisée de bout en bout. Cela comprend une tête de classification légère pour réduire la surcharge de calcul et un sous-échantillonnage spatial-canal découplé pour préserver plus efficacement les informations riches sur les caractéristiques.
  • Intégration à l'écosystème Ultralytics : YOLOv10 est intégré de manière transparente dans le framework Ultralytics, bénéficiant d'une expérience utilisateur rationalisée, d'interfaces Python et CLI simples, de processus d'entraînement efficaces et de poids pré-entraînés facilement disponibles.

Points forts et faiblesses

Points forts :

  • Performances de pointe : Offre un équilibre exceptionnel entre vitesse et précision, surpassant souvent les modèles plus anciens comme EfficientDet avec une large marge en termes de latence réelle.
  • Déploiement de bout en bout : La conception sans NMS le rend véritablement de bout en bout, ce qui constitue un avantage significatif pour l'inférence en temps réel.
  • Facilité d'utilisation : En tant que membre de l'écosystème Ultralytics, YOLOv10 est incroyablement facile à utiliser. Les développeurs peuvent entraîner, valider et déployer des modèles avec seulement quelques lignes de code.
  • Écosystème bien maintenu : Bénéficie d'un développement actif, d'une forte communauté open source, de mises à jour fréquentes et d'une intégration avec des outils tels que Ultralytics HUB pour un MLOps transparent.
  • Efficacité de la mémoire : Les modèles YOLOv10 sont conçus pour une utilisation efficace de la mémoire, nécessitant souvent moins de mémoire CUDA pendant l’entraînement et l’inférence par rapport à d’autres architectures complexes.

Faiblesses :

  • Spécialisation de tâche : Comme EfficientDet, YOLOv10 est principalement axé sur la détection d’objets. Pour les projets nécessitant des capacités multitâches, un modèle tel que Ultralytics YOLOv8 pourrait être plus approprié, car il prend en charge la segmentation, la classification et l’estimation de pose dans un cadre unifié.

Cas d'utilisation idéaux

YOLOv10 excelle dans les applications où la vitesse et l'efficacité sont essentielles.

  • Applications en temps réel : Sa faible latence le rend parfait pour les systèmes autonomes, la robotique et la vidéosurveillance à haute vitesse.
  • Edge AI : Les variantes plus petites (YOLOv10n, YOLOv10s) sont hautement optimisées pour un déploiement sur des appareils périphériques aux ressources limitées, tels que les NVIDIA Jetson et les Raspberry Pi.
  • Automatisation industrielle : Idéal pour le contrôle qualité sur les chaînes de production, où une détection rapide et précise est nécessaire pour suivre le rythme des processus de fabrication.

En savoir plus sur YOLOv10

Analyse des performances : Vitesse, précision et efficacité

La comparaison des performances entre EfficientDet et YOLOv10 met en évidence les progrès rapides de l'architecture et de l'optimisation des modèles.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
  • Vitesse GPU : YOLOv10 démontre un avantage considérable en termes de latence GPU. Par exemple, YOLOv10-B atteint un mAP plus élevé qu’EfficientDet-d6 (52,7 contre 52,6), mais est plus de 13 fois plus rapide sur un GPU T4 avec TensorRT.
  • Précision vs. Paramètres : Les modèles YOLOv10 offrent systématiquement une meilleure précision pour un nombre de paramètres donné. YOLOv10-L surpasse EfficientDet-d7 en précision (53,3 contre 53,7 est très proche) tout en étant plus de 10 fois plus rapide et en utilisant près de la moitié des paramètres.
  • Efficacité globale : Bien qu'EfficientDet-d0 ait le nombre de FLOPs le plus faible, YOLOv10n offre un mAP beaucoup plus élevé (39,5 contre 34,6) et est nettement plus rapide sur GPU avec un nombre comparable de paramètres. Cela montre que les architectures modernes comme YOLOv10 offrent un meilleur compromis en termes d'efficacité pratique que la simple minimisation des FLOPs.

Conclusion : Quel modèle devriez-vous choisir ?

Bien qu'EfficientDet ait été un modèle pionnier pour son époque, YOLOv10 est le grand gagnant pour presque toutes les applications modernes. Il offre une vitesse et une précision supérieures, et sa conception de bout en bout sans NMS est un avantage significatif pour le déploiement dans le monde réel.

Pour les développeurs et les chercheurs, le choix est rendu encore plus clair par les avantages de l'écosystème Ultralytics. YOLOv10 offre :

  • Performance supérieure : Un meilleur compromis entre la vitesse et la précision sur le matériel moderne.
  • Facilité d'utilisation : Une API simple et unifiée pour l'entraînement, la validation et l'inférence.
  • Un écosystème robuste : Accédez à une documentation complète, à un support communautaire actif et à des outils tels que Ultralytics HUB pour rationaliser l'ensemble du pipeline MLOps.

Pour les projets qui nécessitent plus que de la simple détection d'objets, nous recommandons d'explorer Ultralytics YOLOv8, qui fournit un framework polyvalent et de pointe pour la détection, la segmentation, l'estimation de pose, la classification et le suivi.

Explorer d’autres comparaisons de modèles

Pour éclairer davantage votre décision, explorez d'autres comparaisons impliquant ces modèles et d'autres modèles de pointe :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires