EfficientDet vs YOLO11 : Une comparaison technique complète

Choisir l'architecture de réseau neuronal optimale est le fondement de toute application de vision par ordinateur réussie. Ce guide complet propose une comparaison technique approfondie entre l'EfficientDet de Google et Ultralytics YOLO11, en analysant leurs différences architecturales, leurs métriques de performance et leurs scénarios de déploiement idéaux.

Que tu vises une latence à la milliseconde sur des appareils d'Edge AI ou que tu aies besoin d'une précision évolutive pour l'inférence basée sur le cloud, comprendre les nuances de ces modèles est crucial.

Profils des modèles et détails techniques

Comprendre la lignée et la philosophie de conception sous-jacente de chaque architecture aide à contextualiser leurs performances dans des tâches de détection d'objets réelles.

EfficientDet

Développé par des chercheurs de Google Brain, EfficientDet a introduit une approche fondée sur le principe de mise à l'échelle des réseaux de détection d'objets, ainsi que le nouveau BiFPN (Bidirectional Feature Pyramid Network).

En savoir plus sur EfficientDet

YOLO11

YOLO11 représente une évolution significative dans l'écosystème Ultralytics, repoussant les limites des performances en temps réel, de l'efficacité des paramètres et de l'apprentissage multitâche.

En savoir plus sur YOLO11

Comparaison architecturale

Les différences architecturales entre ces deux modèles soulignent la divergence des stratégies de conception au fil des ans.

EfficientDet tire parti de la dorsale EfficientNet et introduit le BiFPN, qui permet une fusion des caractéristiques multi-échelles descendante et ascendante. Il utilise une méthode de mise à l'échelle composée qui adapte uniformément la résolution, la profondeur et la largeur pour l'ensemble des réseaux de dorsale, de caractéristiques et de prédiction de boîtes/classes simultanément. Bien qu'il soit très efficace pour maximiser la précision moyenne (mAP), le routage complexe du BiFPN peut parfois créer un goulot d'étranglement pour la bande passante mémoire pendant l'inférence.

YOLO11, en revanche, utilise un module C2f optimisé et une tête de détection avancée sans ancres (anchor-free). Cette approche rationalisée minimise la surcharge lors de l'extraction des caractéristiques. Ultralytics a conçu YOLO11 pour maximiser l'utilisation du matériel GPU, ce qui se traduit par des besoins en mémoire nettement inférieurs lors de l'entraînement et de l'inférence par rapport aux architectures plus anciennes ou aux modèles de transformer lourds.

Polyvalence multitâche

Alors qu'EfficientDet est strictement un détecteur d'objets, YOLO11 affiche une polyvalence extrême. Une seule architecture YOLO11 prend nativement en charge la segmentation d'instance, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB).

Benchmarks de performance

Le tableau ci-dessous compare les performances des deux familles de modèles à différentes échelles sur le jeu de données COCO.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755,2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053,7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24,720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analyse équilibrée : Points forts et faiblesses

Accélération GPU : YOLO11 domine dans les environnements GPU. Par exemple, YOLO11m fournit un mAP de 51,5 % à une vitesse fulgurante de 4,7 ms sur un GPU T4 utilisant TensorRT. Pour atteindre une précision comparable, EfficientDet-d5 prend 67,86 ms, soit plus de 14 fois plus lentement. Cela souligne l'équilibre de performance supérieur des modèles Ultralytics pour les applications en temps réel.

Environnements CPU : EfficientDet affiche des vitesses d'inférence CPU hautement optimisées dans ses variantes plus petites (comme d0 et d1) en utilisant ONNX. Cependant, sa précision évolue mal sans subir d'énormes pénalités de latence GPU dans les variantes plus grandes comme d7.

Méthodologie d'entraînement et écosystème

L'expérience développeur est souvent aussi critique que les capacités théoriques du modèle. C'est là que l'écosystème Ultralytics brille.

EfficientDet repose fortement sur l'écosystème hérité TensorFlow et sur des bibliothèques AutoML complexes. La mise en place d'un pipeline d'entraînement personnalisé implique des courbes d'apprentissage abruptes, une gestion complexe des dépendances et une configuration manuelle des ancres et des fonctions de perte.

À l'inverse, Ultralytics offre une facilité d'utilisation inégalée. Soutenu par un écosystème PyTorch bien entretenu, l'entraînement d'un modèle YOLO ne nécessite que quelques lignes de code. Le framework gère automatiquement le réglage des hyperparamètres, les augmentations de données avancées et la planification optimale du taux d'apprentissage, dès le départ.

Exemple de code : Premiers pas avec Ultralytics

Cet extrait robuste, prêt pour la production, démontre à quel point l'entraînement et l'inférence sont simples au sein de l'API Python.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Cas d'utilisation idéaux

Quand utiliser EfficientDet : EfficientDet reste un choix viable pour les environnements de recherche fortement ancrés dans les pipelines TensorFlow ou pour des contraintes spécifiques liées au CPU où les premières architectures comme d0 fonctionnent de manière adéquate.

Quand utiliser YOLO11 : YOLO11 est le choix définitif pour les déploiements en entreprise modernes. Sa vitesse exceptionnelle le rend parfait pour les véhicules autonomes, l'analyse sportive en temps réel et la détection de défauts de fabrication à haut débit. De plus, sa plus faible utilisation de mémoire permet un déploiement flexible sur du matériel aux ressources limitées comme le NVIDIA Jetson.

Regard vers l'avenir : La mise à niveau YOLO26

Bien que YOLO11 soit exceptionnellement performant, les développeurs qui commencent de nouveaux projets devraient évaluer d'autres architectures Ultralytics comme le YOLOv8 éprouvé ou le tout nouveau YOLO26. Sorti début 2026, YOLO26 prend la base de YOLO11 et introduit plusieurs innovations révolutionnaires :

  • Conception de bout en bout sans NMS : S'appuyant sur l'héritage de YOLOv10, YOLO26 élimine complètement la suppression non maximale (NMS) lors du post-traitement, réduisant la latence et simplifiant les pipelines de déploiement.
  • Optimiseur MuSGD : Un optimiseur hybride mélangeant le SGD standard avec Muon (inspiré par l'entraînement des grands modèles de langage), améliorant radicalement la stabilité de l'entraînement.
  • Inférence CPU jusqu'à 43 % plus rapide : Des optimisations spécifiques rendent YOLO26 incroyablement puissant sur les appareils Edge dépourvus de GPU dédiés.
  • ProgLoss + STAL : Des fonctions de perte avancées qui améliorent remarquablement la détection des petits objets, critique pour l'imagerie aérienne et la robotique.

Explore le paysage plus large des architectures de vision, y compris les détecteurs basés sur des transformateurs comme RT-DETR, dans nos Ultralytics Docs complets.

Commentaires