EfficientDet vs. YOLO: une comparaison détaillée pour la détection d'objets
Le choix du modèle de détection d'objets optimal est une décision cruciale pour les projets de vision par ordinateur, car différents modèles offrent des avantages uniques en termes de précision, de vitesse et d'efficacité. Cette page propose une comparaison technique détaillée entre EfficientDet et YOLO, deux modèles de premier plan dans le domaine de la détection d'objets. Nous analysons leurs architectures, leurs performances et leur adéquation à diverses applications afin de vous aider à faire un choix éclairé.
EfficientDet
EfficientDet a été introduit par Google en 2019 et est connu pour son efficacité et son évolutivité dans la détection d'objets. Il atteint une précision de pointe avec beaucoup moins de paramètres et de FLOP par rapport à de nombreux détecteurs contemporains.
Architecture et caractéristiques principales
EfficientDet utilise une série d'innovations architecturales pour améliorer à la fois l'efficacité et la précision :
- Réseau principal : Utilise EfficientNet comme colonne vertébrale, connu pour son efficacité et son évolutivité, obtenues grâce à la recherche par architecture neuronale.
- BiFPN (Bi-directional Feature Pyramid Network) : Un réseau bidirectionnel pondéré de pyramides de caractéristiques qui permet une fusion efficace des caractéristiques à plusieurs échelles.
- Mise à l'échelle des composés : Augmente systématiquement toutes les dimensions du détecteur (épine dorsale, réseau de caractéristiques, résolution du réseau de prédiction de boîte/classe) à l'aide d'un coefficient composé.
Mesures de performance
Les modèles EfficientDet existent en différentes tailles (d0 à d7), offrant une gamme de compromis de performance pour s'adapter aux différentes ressources informatiques.
- mAP: atteint une précision moyenne élevée (mAP) sur l'ensemble de données COCO, ce qui témoigne d'une grande précision de détection.
- Vitesse d'inférence: Offre une gamme de vitesses d'inférence en fonction de la taille du modèle, les modèles plus petits étant adaptés aux applications en temps réel.
- Taille du modèle: Les modèles EfficientDet sont conçus pour être efficaces en termes de paramètres, ce qui permet de réduire la taille des modèles par rapport à d'autres détecteurs de haute précision.
Forces et faiblesses
Points forts :
- Haute efficacité : Excellent équilibre entre la précision et le coût de calcul, ce qui le rend adapté aux environnements à ressources limitées.
- Évolutivité : La mise à l'échelle composée permet une mise à l'échelle facile du modèle pour atteindre les niveaux de performance souhaités.
- Précision : Permet d'atteindre une précision de pointe avec moins de paramètres.
- Mise en œuvre bien documentée: Le référentiel AutoML de Google fournit une implémentation claire et des modèles pré-entraînés.
Faiblesses :
- Complexité : Les stratégies de mise à l'échelle de la BiFPN et des composés ajoutent de la complexité à l'architecture.
- Vitesse d'inférence : bien qu'efficace, la vitesse d'inférence peut ne pas être aussi rapide que certains détecteurs en temps réel tels que les modèlesYOLO 'Ultralytics , en particulier pour les variantes EfficientDet les plus importantes.
Cas d'utilisation
EfficientDet est bien adapté aux applications où la précision et l'efficacité sont cruciales :
- Appareils mobiles et périphériques : En raison de son efficacité, il peut être déployé sur des appareils mobiles et des plates-formes informatiques de périphérie.
- Robotique: Convient aux applications robotiques nécessitant une détection précise et efficace des objets.
- Applications à ressources limitées: Idéal pour les scénarios où les ressources informatiques sont limitées, mais où une grande précision est nécessaire.
En savoir plus sur EfficientDet
DAMO-YOLO
YOLO, présenté par le groupe Alibaba en 2022, est conçu pour la détection rapide et précise d'objets, en particulier pour les applications industrielles. Il intègre plusieurs nouvelles techniques pour parvenir à un équilibre entre vitesse et précision.
Architecture et caractéristiques principales
YOLO intègre plusieurs éléments innovants dans son architecture :
- Backbone basé sur NAS : Emploie une architecture neuronale de recherche (NAS), optimisant à la fois la vitesse et la précision.
- RepGFPN (Reparameterized Gradient Feature Pyramid Network) : Un réseau efficace de fusion de caractéristiques qui améliore la représentation des caractéristiques tout en maintenant l'efficacité de calcul.
- ZeroHead : une tête de détection légère conçue pour minimiser la latence.
- AlignedOTA (Aligned Optimal Transport Assignment) : Une stratégie d'affectation avancée pour améliorer la formation et la précision.
Mesures de performance
Les modèles YOLO sont disponibles en différentes tailles (t, s, m, l) pour répondre aux différents besoins de performance.
- mAP: Obtention d'un mAP compétitif sur l'ensemble de données COCO, démontrant de bonnes performances en matière de détection d'objets.
- Vitesse d'inférence: Priorité à une vitesse d'inférence élevée, ce qui le rend adapté aux applications en temps réel et sensibles à la latence.
- Taille du modèle: Conçu pour être efficace, il offre un bon équilibre entre la taille du modèle et les performances.
Forces et faiblesses
Points forts :
- Haute vitesse : vitesse d'inférence exceptionnelle, optimisée pour les applications en temps réel.
- L'accent est mis sur l'industrie : Spécialement conçu pour les applications industrielles, il met l'accent sur le déploiement pratique.
- Précision : Maintient une grande précision tout en atteignant des vitesses d'inférence rapides.
- Techniques avancées : Intègre des techniques de pointe telles que NAS backbone et AlignedOTA pour des performances accrues.
- Source ouverte : Disponible publiquement avec le code et les modèles pré-entraînés.
Faiblesses :
- Relativement nouveau : En tant que modèle plus récent, la communauté et l'écosystème peuvent être encore en développement par rapport à des modèles plus établis.
- Complexité : L'intégration de multiples techniques avancées peut rendre l'architecture complexe à modifier ou à personnaliser en profondeur.
Cas d'utilisation
YOLO est particulièrement efficace dans les scénarios nécessitant la détection d'objets en temps réel avec une grande précision :
- Inspection industrielle : Idéal pour le contrôle de la qualité et l'inspection des processus de fabrication.
- Conduite autonome : Convient aux véhicules autonomes et aux systèmes avancés d'aide à la conduite (ADAS) pour lesquels une faible latence est essentielle.
- Analyse vidéo en temps réel : Applications telles que la surveillance du trafic et les systèmes de sécurité.
- Edge AI: déploiement sur des appareils périphériques pour un traitement en temps réel.
Tableau de comparaison des modèles
Modèle | taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusion
EfficientDet et YOLO sont tous deux des modèles de détection d'objets puissants qui présentent des atouts distincts. EfficientDet excelle dans la fourniture d'une gamme de modèles efficaces avec une grande précision, ce qui le rend polyvalent pour diverses applications, en particulier celles qui sont soumises à des contraintes de ressources. YOLO, quant à lui, est conçu pour une inférence à grande vitesse sans sacrifier de manière significative la précision, ce qui le rend idéal pour les applications industrielles et de pointe en temps réel.
Pour les utilisateurs intéressés par d'autres modèles de détection d'objets de haute performance, Ultralytics propose une gamme de modèles YOLO , notamment YOLOv5, YOLOv8et le dernier modèle YOLO11. Des comparaisons avec d'autres modèles comme YOLOX sont également disponibles pour vous aider à trouver le meilleur modèle pour vos besoins spécifiques. Envisagez d'explorer Ultralytics HUB pour une formation et un déploiement simplifiés des modèles YOLO .