Passer au contenu

YOLO11 vs EfficientDet : Une comparaison technique détaillée

Cette page offre une comparaison technique détaillée entre Ultralytics YOLO11 et EfficientDet, deux modèles de détection d'objets importants. Nous analysons leurs architectures, leurs bancs d'essai de performance et leur adéquation à différentes applications afin de vous aider à sélectionner le modèle optimal pour vos besoins en matière de vision par ordinateur. Bien que les deux modèles visent une détection d'objets efficace et précise, ils sont issus de différentes lignes de recherche (Ultralytics et Google) et utilisent des philosophies architecturales distinctes.

Ultralytics YOLO11

Ultralytics YOLO11 représente la dernière avancée de la série YOLO (You Only Look Once), développée par Ultralytics et reconnue pour ses capacités exceptionnelles de détection d'objets en temps réel. Il s'appuie sur le succès de ses prédécesseurs comme YOLOv8, en se concentrant sur l'amélioration de la précision et de l'efficacité computationnelle.

Détails techniques :

Architecture et principales fonctionnalités

YOLO11 utilise une architecture sans ancrage à un seul étage optimisée pour la vitesse et la précision. Les principales caractéristiques comprennent des couches d'extraction de caractéristiques affinées et une structure de réseau simplifiée, réduisant le nombre de paramètres et la charge de calcul. Cette conception assure d'excellentes performances sur divers matériels, des appareils périphériques (NVIDIA Jetson, Raspberry Pi) aux serveurs cloud.

Un avantage majeur de YOLO11 est sa polyvalence et son intégration au sein de l'écosystème Ultralytics. Il prend en charge de multiples tâches au-delà de la détection d'objets, notamment la segmentation d'instance, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB). Le framework Ultralytics offre une API Python et une CLI simples, une documentation exhaustive, des poids pré-entraînés facilement disponibles et des processus d'entraînement efficaces avec des besoins en mémoire inférieurs à ceux de nombreuses autres architectures. L'écosystème bénéficie d'un développement actif, d'un fort soutien de la communauté et d'une intégration transparente avec des outils tels que Ultralytics HUB pour une MLOps rationalisée.

Points forts

  • Vitesse et efficacité élevées : Excellente vitesse d’inférence, idéale pour les applications en temps réel.
  • Forte précision : Atteint des scores mAP de pointe dans toutes les tailles de modèle.
  • Polyvalence : Prend en charge les tâches de détection, de segmentation, de classification, de pose et d'OBB dans un cadre unique.
  • Facilité d'utilisation : API simple, documentation complète et écosystème convivial.
  • Écosystème bien entretenu : Activement développé, communauté forte, mises à jour fréquentes et outils comme Ultralytics HUB.
  • Efficacité de l'entraînement : Temps d'entraînement plus rapides et consommation de mémoire plus faible par rapport à de nombreuses alternatives.
  • Flexibilité de déploiement : Optimisé pour divers matériels, de la périphérie au cloud.

Faiblesses

  • Les modèles plus petits privilégient la vitesse, ce qui peut impliquer un compromis sur la précision maximale atteignable par rapport aux variantes les plus grandes.
  • En tant que détecteur à une étape, il peut rencontrer des difficultés avec les objets extrêmement petits dans certaines scènes complexes.

Cas d'utilisation idéaux

YOLO11 excelle dans les applications qui exigent des performances en temps réel et une grande précision :

En savoir plus sur YOLO11

EfficientDet de Google

EfficientDet est une famille de modèles de détection d'objets introduite par l'équipe de Google Brain. Il est conçu pour atteindre une efficacité élevée en optimisant le compromis entre la précision et les ressources de calcul (paramètres et FLOPs).

Détails techniques :

Architecture et principales fonctionnalités

L'architecture d'EfficientDet repose sur trois innovations clés :

  1. Backbone EfficientNet : Il utilise le EfficientNet très efficace comme backbone pour l'extraction de caractéristiques.
  2. BiFPN (Réseau de pyramide de caractéristiques bidirectionnel) : Un nouveau réseau de caractéristiques qui permet une fusion de caractéristiques multi-échelles simple et rapide, améliorant les FPN traditionnels en ajoutant des connexions pondérées.
  3. Mise à l'échelle composite : Une méthode qui met à l'échelle uniformément la profondeur, la largeur et la résolution du backbone, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes. Cela permet de faire évoluer le modèle des petites variantes (D0) aux grandes variantes (D7) afin de s'adapter aux différentes contraintes de ressources.

Points forts

  • Efficacité élevée des paramètres : Offre une grande précision pour un nombre relativement faible de paramètres et de FLOP.
  • Scalabilité : La méthode de mise à l'échelle composite offre une voie claire pour adapter le modèle à différents objectifs de performance.
  • Solides performances de référence : A obtenu des résultats à la fine pointe de la technologie sur l’ensemble de données COCO au moment de sa sortie.

Faiblesses

  • Vitesse d’inférence plus lente : Malgré son efficacité en termes de FLOP, EfficientDet a souvent une latence d’inférence plus élevée que les modèles YOLO, en particulier sur les GPU, ce qui le rend moins adapté à de nombreuses applications en temps réel.
  • Polyvalence limitée : Principalement conçu pour la détection d’objets, il ne prend pas en charge nativement d’autres tâches telles que la segmentation d’instances, l’estimation de pose ou l’OBB qui sont intégrées au framework Ultralytics YOLO.
  • Écosystème moins intégré : Le référentiel d’origine est principalement un artefact de recherche. Il n’a pas la documentation complète, l’API simple et les outils intégrés comme Ultralytics HUB qui simplifient le flux de travail de bout en bout, de la formation au déploiement.
  • Dépendance au Framework : L'implémentation officielle est en TensorFlow, ce qui peut être une limitation pour les développeurs et les chercheurs travaillant principalement dans l'écosystème PyTorch.

Cas d'utilisation idéaux

EfficientDet est bien adapté aux scénarios où la taille du modèle et le coût de calcul théorique sont les contraintes les plus critiques :

  • IA en périphérie (Edge AI) : Déploiement sur des appareils mobiles ou embarqués où la mémoire et la puissance de traitement sont sévèrement limitées.
  • Recherche académique : Étude des lois d'échelle des modèles et de l'efficacité architecturale.
  • Applications Cloud : Scénarios où la minimisation du coût de calcul par inférence est plus importante que l'atteinte de la latence la plus faible possible.

En savoir plus sur EfficientDet

Performances et analyses comparatives : YOLO11 vs. EfficientDet

Lorsqu'on compare les performances, il est essentiel de regarder au-delà du simple mAP. Bien que les deux familles de modèles offrent une gamme de niveaux de précision, YOLO11 est conçu pour une vitesse supérieure dans le monde réel. Le tableau ci-dessous montre que, pour un mAP similaire, les modèles YOLO11 sont nettement plus rapides, en particulier lorsqu'ils sont accélérés avec TensorRT sur un GPU.

Par exemple, YOLO11m atteint le même mAP de 51,5 que EfficientDet-d5, mais est plus de 14 fois plus rapide sur un GPU T4 (4,7 ms contre 67,86 ms) et utilise 40 % moins de paramètres. Cela met en évidence l'équilibre exceptionnel de YOLO11 entre la précision, la vitesse et la taille du modèle, ce qui en fait un choix beaucoup plus pratique pour les applications nécessitant un traitement en temps réel.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Conclusion : Quel modèle devriez-vous choisir ?

Bien qu'EfficientDet ait constitué une avancée significative en matière d'efficacité des modèles, Ultralytics YOLO11 représente une solution plus moderne, pratique et puissante pour la grande majorité des applications de vision par ordinateur.

  • Choisissez EfficientDet si votre principale contrainte est de minimiser les FLOP théoriques ou le nombre de paramètres, et que vous êtes à l’aise de travailler dans son framework axé sur la recherche.

  • Choisissez Ultralytics YOLO11 pour presque tous les autres scénarios. Son compromis supérieur entre vitesse et précision, son incroyable polyvalence dans de multiples tâches de vision et sa facilité d’utilisation en font le choix définitif pour les développeurs et les chercheurs. L’écosystème bien entretenu, comprenant une documentation complète, un soutien communautaire actif et des outils comme Ultralytics HUB, assure une expérience de développement et de déploiement en douceur, de l’expérimentation initiale à la production à grande échelle.

Autres comparaisons de modèles

Pour une exploration plus approfondie, considérez ces comparaisons impliquant YOLO11 et d'autres modèles pertinents :



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires