EfficientDet vs YOLO11: comparaison technique complète
Le choix de l'architecture optimale du réseau neuronal est la base de toute application réussie en vision par ordinateur. Ce guide complet fournit une comparaison technique approfondie entre EfficientDet Google et Ultralytics YOLO11d'Ultralytics, en analysant leurs différences architecturales, leurs mesures de performance et leurs scénarios de déploiement idéaux.
Que vous visiez une latence de l'ordre de la milliseconde sur des appareils IA de pointe ou que vous ayez besoin d'une précision évolutive pour l'inférence basée sur le cloud, il est essentiel de comprendre les nuances de ces modèles.
Profils des modèles et détails techniques
Comprendre la généalogie et la philosophie de conception sous-jacente de chaque architecture aide à contextualiser leurs performances dans des tâches réelles de détection d'objets.
EfficientDet
Développé par des chercheurs de Google Brain, EfficientDet a introduit une approche structurée pour la mise à l'échelle des réseaux de détection d'objets parallèlement au nouveau BiFPN (Réseau de Pyramide de Caractéristiques Bidirectionnel).
- Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
- Organisation :Google
- Date : 2019-11-20
- Arxiv :https://arxiv.org/abs/1911.09070
- GitHub :https://github.com/google/automl/tree/master/efficientdet
- Documentation :https://github.com/google/automl/tree/master/efficientdet#readme
En savoir plus sur EfficientDet
YOLO11
YOLO11 une évolution significative dans Ultralytics , repoussant les limites des performances en temps réel, de l'efficacité des paramètres et de l'apprentissage multitâche.
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation :Ultralytics
- Date : 2024-09-27
- GitHub :https://github.com/ultralytics/ultralytics
- Documentation :https://docs.ultralytics.com/models/YOLO11/
Comparaison architecturale
Les différences architecturales entre ces deux modèles soulignent la divergence des stratégies de conception au fil des ans.
EfficientDet exploite l'infrastructure EfficientNet et introduit BiFPN, qui permet une fusion de caractéristiques multi-échelles descendante et ascendante. Il utilise une méthode de mise à l'échelle composite qui adapte uniformément la résolution, la profondeur et la largeur pour toutes les infrastructures, tous les réseaux de caractéristiques et tous les réseaux de prédiction de boîte/classe simultanément. Bien que très efficace pour maximiser la précision moyenne (mAP), le routage complexe dans BiFPN peut parfois créer un goulot d'étranglement dans la bande passante mémoire pendant l'inférence.
YOLO11, quant à lui, utilise un module C2f optimisé et une tête de détection avancée sans ancrage. Cette approche rationalisée minimise la charge pendant l'extraction des caractéristiques. Ultralytics YOLO11 maximiser l'utilisation GPU , ce qui se traduit par des besoins en mémoire nettement inférieurs pendant l'entraînement et l'inférence par rapport aux architectures plus anciennes ou aux modèles de transformateurs lourds.
Polyvalence multitâche
Alors qu'EfficientDet est strictement un détecteur d'objets, YOLO11 une extrême polyvalence. Une seule YOLO11 prend en charge nativement la segmentation d'instances, la classification d'images, l'estimation de poses et les boîtes englobantes orientées (OBB).
Bancs d'essai de performance
Le tableau ci-dessous compare les performances des deux familles de modèles à différentes échelles sur l'ensemble COCO .
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Analyse équilibrée : Forces et faiblesses
GPU : YOLO11 dans GPU . Par exemple, YOLO11m offre un mAP 51,5 % à une vitesse fulgurante de 4,7 ms sur un GPU T4 GPU TensorRT. Pour atteindre une précision comparable, EfficientDet-d5 nécessite 67,86 ms, soit plus de 14 fois plus lent. Cela met en évidence l'équilibre supérieur des performances Ultralytics pour les applications en temps réel.
Environnements CPU : EfficientDet présente des vitesses d'inférence CPU hautement optimisées dans ses variantes plus petites (comme d0 et d1) en utilisant ONNX. Cependant, sa précision s'adapte mal sans entraîner de lourdes pénalités de latence GPU dans les variantes plus grandes comme d7.
Méthodologie d'entraînement et écosystème
L'expérience développeur est souvent aussi importante que les capacités théoriques du modèle. C'est là que Ultralytics excelle.
EfficientDet s'appuie fortement sur l'héritage TensorFlow et aux bibliothèques AutoML complexes. La mise en place d'un pipeline de formation personnalisé implique des courbes d'apprentissage abruptes, une gestion complexe des dépendances et une configuration manuelle des ancres et des fonctions de perte.
Inversement, Ultralytics offre une facilité d'utilisation inégalée. Soutenu par un écosystème PyTorch bien entretenu, l'entraînement d'un modèle YOLO ne nécessite que quelques lignes de code. Le framework gère automatiquement le réglage des hyperparamètres, les augmentations de données avancées et la planification optimale du taux d'apprentissage dès l'installation.
Exemple de code : Premiers pas avec Ultralytics
Cet extrait de code robuste et prêt à l'emploi montre à quel point l'apprentissage et l'inférence sont simples dans Python .
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
Cas d'utilisation idéaux
Quand utiliser EfficientDet : EfficientDet reste un choix viable pour les environnements de recherche fortement ancrés dans les pipelines TensorFlow ou les contraintes spécifiques liées au CPU où les architectures anciennes comme d0 fonctionnent adéquatement.
Quand utiliser YOLO11 : YOLO11 est le choix définitif pour les déploiements d'entreprise modernes. Sa vitesse exceptionnelle le rend parfait pour les véhicules autonomes, l'analyse sportive en temps réel et la détection de défauts de fabrication à haut débit. De plus, sa faible consommation de mémoire permet un déploiement flexible sur du matériel à ressources contraintes comme le NVIDIA Jetson.
Perspectives d'avenir : la mise à niveau YOLO26
Bien que YOLO11 exceptionnellement performant, les développeurs qui lancent de nouveaux projets devraient évaluer d'autres Ultralytics telles que le système éprouvé YOLOv8 ou la nouvelle YOLO26. Lancée début 2026, YOLO26 s'appuie sur les fondements de YOLO11 introduit plusieurs innovations révolutionnaires :
- Conception de bout en bout sans NMS : S'appuyant sur l'héritage de YOLOv10, YOLO26 élimine complètement la suppression non maximale (NMS) lors du post-traitement, réduisant drastiquement la latence et simplifiant les pipelines de déploiement.
- Optimiseur MuSGD : Un optimiseur hybride combinant le SGD standard avec Muon (inspiré par l'entraînement des grands modèles de langage), améliorant drastiquement la stabilité de l'entraînement.
- Jusqu'à 43 % plus rapide pour l'inférence CPU : Des optimisations spécifiques rendent YOLO26 incroyablement puissant sur les appareils edge dépourvus de GPU discrets.
- ProgLoss + STAL : Des fonctions de perte avancées qui améliorent remarquablement la détection de petits objets, essentiel pour l'imagerie aérienne et la robotique.
Explorez le paysage plus large des architectures de vision, y compris les détecteurs basés sur des transformateurs tels que RT-DETR, dans notre Ultralytics complète.