EfficientDet vs YOLO11: évaluation de l'évolution de la détection d'objets
Le choix de l'architecture optimale pour les applications de vision par ordinateur implique souvent de trouver un équilibre entre l'efficacité de calcul et la précision de détection. Cette comparaison exhaustive explore les différences techniques entre EfficientDet, l'architecture de détection évolutive Google datant de 2019, et YOLO11, une version 2024 d' Ultralytics qui a redéfini les performances en temps réel.
Alors qu'EfficientDet a introduit des concepts révolutionnaires en matière de mise à l'échelle des modèles, YOLO11 une avancée significative en termes de facilité d'utilisation, de vitesse d'inférence et de polyvalence multitâche. Pour les développeurs qui lancent de nouveaux projets en 2026, nous recommandons également d'explorer la dernière version YOLO26, qui s'appuie sur les innovations présentées ici avec un traitement natif de bout en bout.
Analyse comparative des performances
Le paysage de la détection d'objets a radicalement changé, passant de l'optimisation des FLOP théoriques à l'optimisation de la latence dans le monde réel. Le tableau ci-dessous met en évidence le contraste saisissant entre les vitesses d'inférence. Alors qu'EfficientDet-d0 nécessite environ 10 ms pour CPU , les architectures modernes telles que YOLO11n effectuent des tâches similaires beaucoup plus rapidement, souvent en moins de 2 ms sur un matériel comparable, tout en conservant une précision moyenne (mAP) compétitive.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 1.5 | 2.6 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 2.5 | 9.4 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 4.7 | 20.1 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 6.2 | 25.3 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 11.3 | 56.9 | 56.9 | 194.9 |
EfficientDet : le pionnier du redimensionnement des composés
Développé par l'équipe Google , EfficientDet s'est imposé comme une approche systématique de la mise à l'échelle des modèles. Il s'appuie sur l'architecture EfficientNet et introduit le réseau pyramidal bidirectionnel pondéré (BiFPN), qui permet une fusion facile et rapide des caractéristiques à plusieurs échelles.
L'innovation principale résidait dans le « compound scaling », une méthode qui adapte de manière uniforme la résolution, la profondeur et la largeur du réseau central, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes. Cela a permis à la famille EfficientDet (D0 à D7) de cibler un large éventail de contraintes en matière de ressources, des appareils mobiles aux GPU haute puissance.
Malgré son succès académique et sa grande efficacité en termes de FLOP, EfficientDet est souvent confronté à des problèmes de latence sur le matériel réel en raison des coûts d'accès à la mémoire liés à ses connexions BiFPN complexes et à ses convolutions séparables en profondeur, qui ne sont pas toujours optimisées par des accélérateurs tels que TensorRT.
Métadonnées EfficientDet :
- Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
- Organisation :Google Research
- Date : 2019-11-20
- Arxiv :EfficientDet : detect d’objets évolutive et efficace
- GitHub :google/automl
En savoir plus sur EfficientDet
Ultralytics YOLO11: redéfinir l'état de l'art en temps réel
Sorti en septembre 2024, YOLO11 est conçu pour la détection pratique et rapide d'objets et un déploiement instantané. Contrairement à EfficientDet, qui met fortement l'accent sur l'efficacité des paramètres, YOLO11 l'utilisation du matériel, garantissant ainsi que le modèle fonctionne exceptionnellement rapidement à la fois sur les processeurs périphériques et les processeurs graphiques d'entreprise.
YOLO11 des améliorations architecturales telles que le bloc C3k2 et un module SPPF (Spatial Pyramid Pooling - Fast) amélioré. Ces changements renforcent la capacité du modèle à extraire des caractéristiques à différentes échelles sans la pénalité de latence observée dans les anciennes conceptions de pyramides de caractéristiques. De plus, YOLO11 un cadre unifié pour plusieurs tâches de vision, notamment la segmentation d'instances, l'estimation de pose et la détection de boîtes englobantes orientées (OBB), des capacités qui nécessitent des implémentations personnalisées complexes avec EfficientDet.
Avantage de l'écosystème
Ultralytics sont entièrement intégrés à la Ultralytics , ce qui permet une gestion transparente des ensembles de données, une annotation automatique et un apprentissage des modèles en un clic dans le cloud.
YOLO11 :
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation :Ultralytics
- Date : 2024-09-27
- GitHub :ultralytics/ultralytics
- Docs :Documentation YOLO11
Différences Techniques Clés
Architecture et fusion de fonctionnalités
EfficientDet s'appuie sur BiFPN, une couche complexe de fusion de caractéristiques pondérées qui relie les cartes de caractéristiques de manière répétée, de haut en bas et de bas en haut. Bien que théoriquement efficace, les modèles d'accès à la mémoire irréguliers peuvent ralentir l'inférence sur les GPU.
En revanche, YOLO11 une architecture simplifiée inspirée du PANet (Path Aggregation Network) avec des blocs C3k2. Cette conception favorise des modèles d'accès mémoire denses et réguliers qui s'alignent bien avec CUDA et les architectures NPU modernes, ce qui se traduit par les gains de vitesse considérables observés dans le tableau de référence (par exemple, YOLO11x est beaucoup plus rapide que EfficientDet-d7 tout en conservant une précision supérieure).
Efficacité de l'entraînement et facilité d'utilisation
La formation d'un modèle EfficientDet implique généralement l'utilisation de l'API TensorFlow Detection ou de la bibliothèque AutoML, qui peuvent présenter une courbe d'apprentissage abrupte et des fichiers de configuration complexes.
Ultralytics l'expérience des développeurs. La formation YOLO11 accessible via une Python simple ou une interface de ligne de commande (CLI). La bibliothèque gère automatiquement le réglage des hyperparamètres, l'augmentation des données et le formatage des ensembles de données.
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Polyvalence et déploiement
EfficientDet est avant tout une architecture de détection d'objets. Son adaptation à des tâches telles que la segmentation ou l'estimation de pose nécessite des modifications architecturales importantes.
YOLO11 nativement multimodal. La même infrastructure et le même pipeline d'entraînement prennent en charge :
- Détection : Boîtes englobantes standard.
- Segmentation : masques au niveau des pixels pour des contours d'objets précis.
- Classification : Catégorisation d’images entières.
- Pose : détection des points clés pour le suivi squelettique.
- OBB : Boîtes pivotées pour l'imagerie aérienne et la détection de texte.
Cette polyvalence fait de YOLO11 « couteau suisse » pour les ingénieurs en IA, permettant à un seul référentiel d'alimenter diverses applications, de l'imagerie médicale à la robotique autonome.
Pourquoi choisir les modèles Ultralytics ?
Lorsque l'on compare ces deux architectures pour les systèmes de production modernes, Ultralytics offrent des avantages distincts :
- Empreinte mémoire réduite : YOLO sont optimisés pour être entraînés sur du matériel grand public. Contrairement aux modèles basés sur des transformateurs ou aux anciennes architectures lourdes qui nécessitent CUDA importante, YOLO efficaces démocratisent l'accès à l'entraînement IA haut de gamme.
- Déploiement simplifié : exportation vers ONNX, TensorRT, CoreML ou TFLite l'aide d'une seule ligne de commande dans la Ultralytics .
- Assistance active : la Ultralytics est dynamique et active. Grâce à des mises à jour fréquentes, le framework garantit la compatibilité avec les dernières versions de PyTorch CUDA.
Conclusion : le choix moderne
Si EfficientDet reste une étape importante dans l'histoire de la recherche en vision par ordinateur, démontrant la puissance de la mise à l'échelle composée, YOLO11 et le plus récent YOLO26 constituent aujourd'hui les meilleurs choix pour une mise en œuvre pratique. Ils offrent un meilleur équilibre entre vitesse et précision, une expérience utilisateur nettement plus simple et la flexibilité nécessaire pour gérer plusieurs tâches de vision par ordinateur dans un cadre unique.
Pour les développeurs qui souhaitent rester à la pointe de la technologie, nous recommandons d'étudier YOLO26, qui introduit une conception de bout en bout NMS pour une latence encore plus faible et des pipelines de déploiement plus simples.
Pour découvrir d'autres options hautement performantes, nous vous invitons à lire nos comparaisons sur YOLOv10 ou RT-DETR.