Skip to content

Comparaison technique : YOLOX vs EfficientDet pour la détection d'objets

Les modèlesYOLO d'Ultralytics sont réputés pour leur rapidité et leur précision dans les tâches de détection d'objets. Cette page propose une comparaison technique détaillée entre deux modèles de détection d'objets de premier plan : YOLOX et EfficientDet : Nous examinerons leurs conceptions architecturales, leurs performances, leurs méthodologies d'apprentissage et leurs applications optimales afin de vous aider à sélectionner le modèle le plus adapté à vos besoins en matière de vision par ordinateur.

YOLOX : Détecteur sans ancre de haute performance

YOLOX ("You Only Look Once X") est un détecteur d'objets sans ancrage à la pointe de la technologie, développé par Megvii. Il est conçu pour être simple et performant, comblant ainsi le fossé entre la recherche et les applications industrielles pratiques.

Architecture et caractéristiques principales

YOLOX se distingue par un paradigme de détection sans ancrage, ce qui simplifie l'architecture et accroît l'efficacité. Les points forts de l'architecture sont les suivants

  • Conception sans ancrage: Élimine la complexité des boîtes d'ancrage, ce qui simplifie la mise en œuvre et permet une meilleure généralisation, en particulier pour les objets dont les rapports d'aspect varient.
  • Tête découplée: sépare les têtes de classification et de localisation, ce qui permet d'optimiser chaque tâche et d'améliorer la précision globale.
  • Stratégies de formation avancées: Emploie des techniques telles que l'attribution d'étiquettes SimOTA et une forte augmentation des données (MixUp et Mosaic) pour garantir une formation solide et des performances améliorées.

Auteurs : Zheng Ge, Songtao Liu, Feng Wang, Zeming Li et Jian Sun Organisation : Megvii Date : 2021-07-18 Lien Arxiv : https://arxiv.org/abs/2107.08430 Lien GitHub : https://github.com/Megvii-BaseDetection/YOLOX Lien vers la documentation : https://yolox.readthedocs.io/en/latest/

Mesures de performance

Les modèles YOLOX offrent un équilibre convaincant entre vitesse et précision. Comme l'illustre le tableau de comparaison, YOLOX atteint des scores mAP compétitifs tout en maintenant des vitesses d'inférence rapides, ce qui le rend adapté aux applications en temps réel. Pour plus de détails sur les performances des différents modèles, veuillez vous référer au tableau ci-dessous.

Cas d'utilisation

  • Détection d'objets en temps réel: Idéal pour les applications nécessitant une détection rapide, telles que les systèmes de sécurité et l'analyse vidéo en direct.
  • Appareils périphériques: Performances efficaces sur les appareils à ressources limitées tels que NVIDIA Jetson et les plateformes mobiles.
  • Systèmes autonomes: Bien adapté à la robotique et aux véhicules autonomes pour lesquels une perception rapide et précise est cruciale.

Forces et faiblesses

Points forts :

  • Vitesse d'inférence élevée: L'architecture sans ancrage et la conception optimisée contribuent à un traitement rapide.
  • Simplicité: La conception simplifiée facilite la formation et le déploiement par rapport aux modèles basés sur l'ancrage.
  • Bon équilibre entre précision et rapidité: Offre une précision compétitive sans sacrifier la vitesse d'inférence.

Faiblesses :

  • mAP: Bien qu'il soit très efficace, il peut être légèrement moins précis que certains modèles plus grands et plus complexes dans certains scénarios.

En savoir plus sur YOLOX

EfficientDet : Détection d'objets efficace et évolutive

EfficientDet, développé par Google Research, est réputé pour son évolutivité et son efficacité dans la détection d'objets. Il utilise une famille de modèles qui permettent d'atteindre une précision de pointe avec beaucoup moins de paramètres et de FLOP que les détecteurs précédents.

Architecture et caractéristiques principales

EfficientDet introduit plusieurs innovations pour améliorer à la fois l'efficacité et la précision :

  • BiFPN (Bi-directional Feature Pyramid Network): Permet une fusion efficace des caractéristiques à plusieurs échelles, ce qui permet au réseau d'utiliser efficacement des caractéristiques à différentes résolutions.
  • Mise à l'échelle des composés: Augmentation uniforme de toutes les dimensions du réseau (backbone, BiFPN et réseau de prédiction boîte/classe) à l'aide d'un seul coefficient composé, ce qui simplifie le processus de mise à l'échelle et optimise les performances.
  • Réseau principal efficace: Utilise EfficientNet comme réseau de base, connu pour son efficacité et ses fortes capacités d'extraction de caractéristiques.

Auteurs : Mingxing Tan, Ruoming Pang, et Quoc V. Le Organisation : Google Date : 2019-11-20 Lien Arxiv : https://arxiv.org/abs/1911.09070 Lien GitHub :google Lien vers la documentation :google

Mesures de performance

Les modèles EfficientDet sont conçus pour être très efficaces à différentes échelles, offrant une gamme de modèles de d0 à d7. Ils atteignent d'excellents scores mAP avec un nombre relativement faible de paramètres et de FLOP, ce qui les rend adaptés au déploiement dans des environnements à ressources limitées. Consultez le tableau de comparaison pour obtenir des mesures détaillées.

Cas d'utilisation

  • Déploiement mobile et en périphérie: La petite taille du modèle EfficientDet et sa grande efficacité en font un outil idéal pour les appareils mobiles et les scénarios d'informatique en périphérie.
  • Applications nécessitant une grande précision avec des ressources limitées: Convient aux applications où la précision est primordiale mais où les ressources informatiques sont limitées, telles que l'inspection de la qualité des dispositifs de bord.
  • Appareils alimentés par batterie: La conception économe en énergie permet un déploiement sur des appareils alimentés par batterie et des applications IoT.

Forces et faiblesses

Points forts :

  • Haute efficacité: Permet d'obtenir une précision de pointe avec moins de paramètres et de FLOP, ce qui accélère l'inférence et réduit les coûts de calcul.
  • Évolutivité: La méthode de mise à l'échelle composée permet une mise à l'échelle aisée du modèle pour répondre aux différentes exigences en matière de précision et de ressources.
  • Précision: Bonne performance en termes de mAP, en particulier pour les modèles de petite et moyenne taille.

Faiblesses :

  • Vitesse d'inférence: Bien qu'efficace, EfficientDet peut être plus lent que des modèles spécifiquement optimisés pour la vitesse comme YOLOv10 ou YOLOv8en particulier pour les variantes les plus importantes.

En savoir plus sur EfficientDet

Tableau de comparaison des performances

Modèle taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Découvrez d'autres comparaisons intéressantes entre les modèles de détection d'objets disponibles dans la documentation Ultralytics :

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires