Passer au contenu

EfficientDet vs YOLO11: comparaison technique complète

Le choix de l'architecture optimale du réseau neuronal est la base de toute application réussie en vision par ordinateur. Ce guide complet fournit une comparaison technique approfondie entre EfficientDet Google et Ultralytics YOLO11d'Ultralytics, en analysant leurs différences architecturales, leurs mesures de performance et leurs scénarios de déploiement idéaux.

Que vous visiez une latence de l'ordre de la milliseconde sur des appareils IA de pointe ou que vous ayez besoin d'une précision évolutive pour l'inférence basée sur le cloud, il est essentiel de comprendre les nuances de ces modèles.

Profils des modèles et détails techniques

Comprendre la généalogie et la philosophie de conception sous-jacente de chaque architecture aide à contextualiser leurs performances dans des tâches réelles de détection d'objets.

EfficientDet

Développé par les chercheurs de Google , EfficientDet a introduit une approche méthodique pour mettre à l'échelle les réseaux de détection d'objets, parallèlement au nouveau BiFPN (Bidirectional Feature Pyramid Network).

En savoir plus sur EfficientDet

YOLO11

YOLO11 une évolution significative dans Ultralytics , repoussant les limites des performances en temps réel, de l'efficacité des paramètres et de l'apprentissage multitâche.

En savoir plus sur YOLO11

Comparaison architecturale

Les différences architecturales entre ces deux modèles soulignent la divergence des stratégies de conception au fil des ans.

EfficientDet exploite l'infrastructure EfficientNet et introduit BiFPN, qui permet une fusion de caractéristiques multi-échelles descendante et ascendante. Il utilise une méthode de mise à l'échelle composite qui adapte uniformément la résolution, la profondeur et la largeur pour toutes les infrastructures, tous les réseaux de caractéristiques et tous les réseaux de prédiction de boîte/classe simultanément. Bien que très efficace pour maximiser la précision moyenne (mAP), le routage complexe dans BiFPN peut parfois créer un goulot d'étranglement dans la bande passante mémoire pendant l'inférence.

YOLO11, quant à lui, utilise un module C2f optimisé et une tête de détection avancée sans ancrage. Cette approche rationalisée minimise la charge pendant l'extraction des caractéristiques. Ultralytics YOLO11 maximiser l'utilisation GPU , ce qui se traduit par des besoins en mémoire nettement inférieurs pendant l'entraînement et l'inférence par rapport aux architectures plus anciennes ou aux modèles de transformateurs lourds.

Polyvalence multitâche

Alors qu'EfficientDet est strictement un détecteur d'objets, YOLO11 une extrême polyvalence. Une seule YOLO11 prend en charge nativement la segmentation d'instances, la classification d'images, l'estimation de poses et les boîtes englobantes orientées (OBB).

Bancs d'essai de performance

Le tableau ci-dessous compare les performances des deux familles de modèles à différentes échelles sur l'ensemble COCO .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analyse équilibrée : forces et faiblesses

GPU : YOLO11 dans GPU . Par exemple, YOLO11m offre un mAP 51,5 % à une vitesse fulgurante de 4,7 ms sur un GPU T4 GPU TensorRT. Pour atteindre une précision comparable, EfficientDet-d5 nécessite 67,86 ms, soit plus de 14 fois plus lent. Cela met en évidence l'équilibre supérieur des performances Ultralytics pour les applications en temps réel.

CPU : EfficientDet affiche des vitesses CPU hautement optimisées dans ses variantes plus petites (comme d0 et d1) à l'aide de ONNX. Cependant, sa précision diminue sans entraîner de pénalités GPU massives dans les variantes plus grandes comme d7.

Méthodologie d'entraînement et écosystème

L'expérience développeur est souvent aussi importante que les capacités théoriques du modèle. C'est là que Ultralytics excelle.

EfficientDet s'appuie fortement sur l'héritage TensorFlow et aux bibliothèques AutoML complexes. La mise en place d'un pipeline de formation personnalisé implique des courbes d'apprentissage abruptes, une gestion complexe des dépendances et une configuration manuelle des ancres et des fonctions de perte.

À l'inverse, Ultralytics une facilité d'utilisation inégalée. Grâce à un PyTorch bien entretenu, l'entraînement d'un YOLO ne nécessite que quelques lignes de code. Le framework gère automatiquement le réglage des hyperparamètres, les augmentations de données avancées et la planification optimale du taux d'apprentissage dès son installation.

Exemple de code : Premiers pas avec Ultralytics

Cet extrait de code robuste et prêt à l'emploi montre à quel point l'apprentissage et l'inférence sont simples dans Python .

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Cas d'utilisation idéaux

Quand utiliser EfficientDet : EfficientDet reste un choix viable pour les environnements de recherche fortement ancrés dans TensorFlow ou soumisà des contraintes spécifiques CPU, où les architectures anciennes telles que d0 fonctionnent correctement.

Quand utiliser YOLO11: YOLO11 le choix incontournable pour les déploiements d'entreprise modernes. Sa vitesse exceptionnelle le rend parfait pour les véhicules autonomes, l'analyse sportive en temps réel et la détection des défauts de fabrication à haut débit. De plus, sa faible consommation de mémoire permet un déploiement flexible sur du matériel aux ressources limitées, comme le NVIDIA .

Perspectives d'avenir : la mise à niveau YOLO26

Bien que YOLO11 exceptionnellement performant, les développeurs qui lancent de nouveaux projets devraient évaluer d'autres Ultralytics telles que le système éprouvé YOLOv8 ou la nouvelle YOLO26. Lancée début 2026, YOLO26 s'appuie sur les fondements de YOLO11 introduit plusieurs innovations révolutionnaires :

  • Conception NMS de bout en bout : s'appuyant sur l'héritage de YOLOv10, YOLO26 élimine complètement la suppression non maximale (NMS) pendant le post-traitement, réduisant ainsi considérablement la latence et simplifiant les pipelines de déploiement.
  • Optimiseur MuSGD : un optimiseur hybride combinant SGD standard SGD Muon (inspiré par l'entraînement de grands modèles linguistiques), améliorant considérablement la stabilité de l'entraînement.
  • CPU jusqu'à 43 % plus rapide : des optimisations spécifiques rendent YOLO26 incroyablement puissant sur les appareils périphériques dépourvus de GPU discrets.
  • ProgLoss + STAL : fonctions de perte avancées qui améliorent considérablement la détection des petits objets, essentielle pour l'imagerie aérienne et la robotique.

Explorez le paysage plus large des architectures de vision, y compris les détecteurs basés sur des transformateurs tels que RT-DETR, dans notre Ultralytics complète.


Commentaires