YOLO11 vs EfficientDet : Une comparaison technique détaillée
Cette page offre une comparaison technique détaillée entre Ultralytics YOLO11 et EfficientDet, deux modèles de détection d'objets importants. Nous analysons leurs architectures, leurs bancs d'essai de performance et leur adéquation à différentes applications afin de vous aider à sélectionner le modèle optimal pour vos besoins en matière de vision par ordinateur. Bien que les deux modèles visent une détection d'objets efficace et précise, ils sont issus de différentes lignes de recherche (Ultralytics et Google) et utilisent des philosophies architecturales distinctes.
Ultralytics YOLO11
Ultralytics YOLO11 représente la dernière avancée de la série YOLO (You Only Look Once), développée par Ultralytics et reconnue pour ses capacités exceptionnelles de détection d'objets en temps réel. Il s'appuie sur le succès de ses prédécesseurs comme YOLOv8, en se concentrant sur l'amélioration de la précision et de l'efficacité computationnelle.
Détails techniques :
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : https://github.com/ultralytics/ultralytics
- Docs : https://docs.ultralytics.com/models/yolo11/
Architecture et principales fonctionnalités
YOLO11 utilise une architecture sans ancrage à un seul étage optimisée pour la vitesse et la précision. Les principales caractéristiques comprennent des couches d'extraction de caractéristiques affinées et une structure de réseau simplifiée, réduisant le nombre de paramètres et la charge de calcul. Cette conception assure d'excellentes performances sur divers matériels, des appareils périphériques (NVIDIA Jetson, Raspberry Pi) aux serveurs cloud.
Un avantage majeur de YOLO11 est sa polyvalence et son intégration au sein de l'écosystème Ultralytics. Il prend en charge de multiples tâches au-delà de la détection d'objets, notamment la segmentation d'instance, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB). Le framework Ultralytics offre une API Python et une CLI simples, une documentation exhaustive, des poids pré-entraînés facilement disponibles et des processus d'entraînement efficaces avec des besoins en mémoire inférieurs à ceux de nombreuses autres architectures. L'écosystème bénéficie d'un développement actif, d'un fort soutien de la communauté et d'une intégration transparente avec des outils tels que Ultralytics HUB pour une MLOps rationalisée.
Points forts
- Vitesse et efficacité élevées : Excellente vitesse d’inférence, idéale pour les applications en temps réel.
- Forte précision : Atteint des scores mAP de pointe dans toutes les tailles de modèle.
- Polyvalence : Prend en charge les tâches de détection, de segmentation, de classification, de pose et d'OBB dans un cadre unique.
- Facilité d'utilisation : API simple, documentation complète et écosystème convivial.
- Écosystème bien entretenu : Activement développé, communauté forte, mises à jour fréquentes et outils comme Ultralytics HUB.
- Efficacité de l'entraînement : Temps d'entraînement plus rapides et consommation de mémoire plus faible par rapport à de nombreuses alternatives.
- Flexibilité de déploiement : Optimisé pour divers matériels, de la périphérie au cloud.
Faiblesses
- Les modèles plus petits privilégient la vitesse, ce qui peut impliquer un compromis sur la précision maximale atteignable par rapport aux variantes les plus grandes.
- En tant que détecteur à une étape, il peut rencontrer des difficultés avec les objets extrêmement petits dans certaines scènes complexes.
Cas d'utilisation idéaux
YOLO11 excelle dans les applications qui exigent des performances en temps réel et une grande précision :
- Systèmes autonomes : Robotique et voitures autonomes.
- Sécurité : Systèmes de surveillance et prévention du vol.
- Automatisation industrielle : Contrôle qualité et efficacité du recyclage.
- Vente au détail : Gestion des stocks et analyse client.
EfficientDet de Google
EfficientDet est une famille de modèles de détection d'objets introduite par l'équipe de Google Brain. Il est conçu pour atteindre une efficacité élevée en optimisant le compromis entre la précision et les ressources de calcul (paramètres et FLOPs).
Détails techniques :
- Auteurs : Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organisation : Google
- Date : 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub : https://github.com/google/automl/tree/master/efficientdet
- Docs : https://github.com/google/automl/tree/master/efficientdet#readme
Architecture et principales fonctionnalités
L'architecture d'EfficientDet repose sur trois innovations clés :
- Backbone EfficientNet : Il utilise le EfficientNet très efficace comme backbone pour l'extraction de caractéristiques.
- BiFPN (Réseau de pyramide de caractéristiques bidirectionnel) : Un nouveau réseau de caractéristiques qui permet une fusion de caractéristiques multi-échelles simple et rapide, améliorant les FPN traditionnels en ajoutant des connexions pondérées.
- Mise à l'échelle composite : Une méthode qui met à l'échelle uniformément la profondeur, la largeur et la résolution du backbone, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes. Cela permet de faire évoluer le modèle des petites variantes (D0) aux grandes variantes (D7) afin de s'adapter aux différentes contraintes de ressources.
Points forts
- Efficacité élevée des paramètres : Offre une grande précision pour un nombre relativement faible de paramètres et de FLOP.
- Scalabilité : La méthode de mise à l'échelle composite offre une voie claire pour adapter le modèle à différents objectifs de performance.
- Solides performances de référence : A obtenu des résultats à la fine pointe de la technologie sur l’ensemble de données COCO au moment de sa sortie.
Faiblesses
- Vitesse d’inférence plus lente : Malgré son efficacité en termes de FLOP, EfficientDet a souvent une latence d’inférence plus élevée que les modèles YOLO, en particulier sur les GPU, ce qui le rend moins adapté à de nombreuses applications en temps réel.
- Polyvalence limitée : Principalement conçu pour la détection d’objets, il ne prend pas en charge nativement d’autres tâches telles que la segmentation d’instances, l’estimation de pose ou l’OBB qui sont intégrées au framework Ultralytics YOLO.
- Écosystème moins intégré : Le référentiel d’origine est principalement un artefact de recherche. Il n’a pas la documentation complète, l’API simple et les outils intégrés comme Ultralytics HUB qui simplifient le flux de travail de bout en bout, de la formation au déploiement.
- Dépendance au Framework : L'implémentation officielle est en TensorFlow, ce qui peut être une limitation pour les développeurs et les chercheurs travaillant principalement dans l'écosystème PyTorch.
Cas d'utilisation idéaux
EfficientDet est bien adapté aux scénarios où la taille du modèle et le coût de calcul théorique sont les contraintes les plus critiques :
- IA en périphérie (Edge AI) : Déploiement sur des appareils mobiles ou embarqués où la mémoire et la puissance de traitement sont sévèrement limitées.
- Recherche académique : Étude des lois d'échelle des modèles et de l'efficacité architecturale.
- Applications Cloud : Scénarios où la minimisation du coût de calcul par inférence est plus importante que l'atteinte de la latence la plus faible possible.
En savoir plus sur EfficientDet
Performances et analyses comparatives : YOLO11 vs. EfficientDet
Lorsqu'on compare les performances, il est essentiel de regarder au-delà du simple mAP. Bien que les deux familles de modèles offrent une gamme de niveaux de précision, YOLO11 est conçu pour une vitesse supérieure dans le monde réel. Le tableau ci-dessous montre que, pour un mAP similaire, les modèles YOLO11 sont nettement plus rapides, en particulier lorsqu'ils sont accélérés avec TensorRT sur un GPU.
Par exemple, YOLO11m atteint le même mAP de 51,5 que EfficientDet-d5, mais est plus de 14 fois plus rapide sur un GPU T4 (4,7 ms contre 67,86 ms) et utilise 40 % moins de paramètres. Cela met en évidence l'équilibre exceptionnel de YOLO11 entre la précision, la vitesse et la taille du modèle, ce qui en fait un choix beaucoup plus pratique pour les applications nécessitant un traitement en temps réel.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Conclusion : Quel modèle devriez-vous choisir ?
Bien qu'EfficientDet ait constitué une avancée significative en matière d'efficacité des modèles, Ultralytics YOLO11 représente une solution plus moderne, pratique et puissante pour la grande majorité des applications de vision par ordinateur.
-
Choisissez EfficientDet si votre principale contrainte est de minimiser les FLOP théoriques ou le nombre de paramètres, et que vous êtes à l’aise de travailler dans son framework axé sur la recherche.
-
Choisissez Ultralytics YOLO11 pour presque tous les autres scénarios. Son compromis supérieur entre vitesse et précision, son incroyable polyvalence dans de multiples tâches de vision et sa facilité d’utilisation en font le choix définitif pour les développeurs et les chercheurs. L’écosystème bien entretenu, comprenant une documentation complète, un soutien communautaire actif et des outils comme Ultralytics HUB, assure une expérience de développement et de déploiement en douceur, de l’expérimentation initiale à la production à grande échelle.
Autres comparaisons de modèles
Pour une exploration plus approfondie, considérez ces comparaisons impliquant YOLO11 et d'autres modèles pertinents :
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs RT-DETR
- YOLOX vs EfficientDet
- YOLOv8 vs EfficientDet