Passer au contenu

YOLOv5 EfficientDet : comparaison technique des principaux modèles de vision

Dans le domaine de la vision par ordinateur, le choix de l'architecture optimale pour la détection d'objets est une décision cruciale qui a des répercussions sur tous les aspects, de la précision du modèle aux coûts de déploiement. Ce guide propose une comparaison technique complète entre Ultralytics YOLOv5 et EfficientDet, deux modèles influents qui ont façonné le paysage de l'IA moderne.

Alors qu'EfficientDet a introduit le concept d'efficacité évolutive grâce à la mise à l'échelle composite, YOLOv5 le domaine en combinant des performances de pointe avec une expérience utilisateur inégalée. Cette analyse examine en détail leurs différences architecturales, leurs mesures de performance et leur applicabilité dans le monde réel afin d'aider les développeurs et les chercheurs à faire des choix fondés sur des données.

Aperçu du modèle

Ultralytics YOLOv5

YOLOv5 (You Only Look Once version 5) est un modèle phare dans l'histoire de la détection d'objets. Lancé mi-2020 par Ultralytics, il est rapidement devenu la norme dans le secteur grâce à son équilibre entre vitesse, précision et facilité d'utilisation. Contrairement à ses prédécesseurs, YOLOv5 le premier YOLO à être implémenté nativement dans PyTorch, ce qui le rend particulièrement accessible à la communauté des chercheurs et aux développeurs d'entreprise.

En savoir plus sur YOLOv5

EfficientDet

EfficientDet est une famille de modèles de détection d'objets développée par Google . Elle s'appuie sur l'architecture EfficientNet et introduit un réseau pyramidal bidirectionnel pondéré (BiFPN) ainsi qu'une méthode de mise à l'échelle composite qui adapte uniformément la résolution, la profondeur et la largeur de toutes les architectures, de tous les réseaux de caractéristiques et de tous les réseaux de prédiction de boîtes/classes.

Bancs d'essai de performance interactifs

Pour comprendre les compromis entre ces architectures, il est essentiel de visualiser leurs performances sur des benchmarks standard. Le graphique ci-dessous compare les indicateurs clés sur l'COCO , en mettant en évidence la frontière vitesse-précision.

Indicateurs de performance détaillés

Le tableau suivant présente une analyse détaillée des performances de différents modèles à différentes échelles. Ultralytics affichent systématiquement des vitesses d'inférence supérieures, en particulier lorsqu'ils sont optimisés pour des applications en temps réel.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Architecture et conception

La différence fondamentale entre ces deux modèles réside dans leur philosophie de conception : YOLOv5 l'inférence en temps réel et la facilité d'ingénierie, tandis qu'EfficientDet se concentre sur l'efficacité des paramètres via une fusion complexe des caractéristiques.

YOLOv5: conçu pour la vitesse et la facilité d'utilisation

YOLOv5 une infrastructure CSPDarknet (Cross Stage Partial Network), qui améliore le flux de gradient et réduit les goulots d'étranglement informatiques. Son cou utilise un PANet (Path Aggregation Network) pour agréger les caractéristiques à différentes échelles, garantissant ainsi une détection très précise des objets, qu'ils soient grands ou petits.

L'avantage Ultralytics

L'une des plus grandes forces YOLOv5 réside dans sa conception modulaire. L'accent mis sur les techniques d'optimisation « Bag of Freebies » et « Bag of Specials », qui améliorent la précision sans augmenter le coût de l'inférence, le rend incroyablement robuste pour divers scénarios de déploiement.

EfficientDet : Compound Scaling et BiFPN

EfficientDet s'appuie sur l'architecture EfficientNet et introduit le BiFPN (Bi-directional Feature Pyramid Network). Alors que les FPN standard additionnent les caractéristiques de différents niveaux, le BiFPN applique des poids apprenables à ces caractéristiques, ce qui permet au réseau d'apprendre quelles caractéristiques d'entrée sont les plus importantes. Bien que théoriquement efficace en termes de FLOP, les modèles d'accès à la mémoire complexes et irréguliers du BiFPN peuvent souvent ralentir l'inférence réelle sur les GPU par rapport à l'architecture CSPNet rationalisée de YOLOv5.

Entraînement et facilité d'utilisation

Pour les développeurs, les paramètres « subjectifs » d'un modèle (facilité d'apprentissage, de déploiement et de débogage) sont souvent aussi importants que la précision brute.

Expérience utilisateur simplifiée

Ultralytics sont réputés pour leur expérience « zero-to-hero » (de zéro à héros). YOLOv5 une interface de ligne de commande (CLI) et Python transparentes qui permettent aux utilisateurs de commencer à s'entraîner sur des données personnalisées en quelques minutes. En revanche, les implémentations EfficientDet nécessitent souvent des fichiers de configuration plus complexes et une connaissance approfondie de TensorFlow PyTorch spécifiques pour fonctionner efficacement.

Efficacité et ressources d'entraînement

YOLOv5 hautement optimisé pour l'efficacité de l'entraînement. Il comprend des fonctionnalités telles que le calcul automatique des ancres, l'augmentation des données mosaïques et l'évolution des hyperparamètres. De plus, Ultralytics présentent généralement des besoins en mémoire nettement inférieurs pendant l'entraînement par rapport aux architectures EfficientDet et basées sur des transformateurs. Cela permet aux chercheurs d'entraîner des lots plus importants sur des GPU grand public, démocratisant ainsi l'accès à l'entraînement de modèles haut de gamme.

from ultralytics import YOLO

# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Polyvalence et applications dans le monde réel

Bien qu'EfficientDet soit avant tout un détecteur d'objets, Ultralytics a étendu les capacités de YOLO au-delà des simples cadres de sélection.

Cas d'utilisation idéaux

Choisissez Ultralytics YOLOv5 ou une version plus récente) si :

  • Les performances en temps réel sont essentielles : les applications telles que la conduite autonome, l'analyse vidéo et la robotique nécessitent la faible latence offerte par YOLO .
  • Déploiement en périphérie : vous effectuez un déploiement sur des appareils mobiles, Raspberry Pi ou NVIDIA où la mémoire et la puissance de calcul sont limitées.
  • Développement rapide : vous devez pouvoir itérer rapidement grâce à une API stable et bien documentée, ainsi qu'à une communauté active.

Choisissez EfficientDet si :

  • Les contraintes FLOPs sont primordiales : dans des scénarios théoriques très spécifiques où les FLOPs sont la seule contrainte (plutôt que la latence), la mise à l'échelle d'EfficientDet peut offrir des avantages.
  • Références de recherche : vous effectuez une comparaison spécifique avec des extracteurs de caractéristiques basés sur EfficientNet dans un contexte universitaire.

L'avenir : YOLO26

Si YOLOv5 un outil puissant, le domaine a évolué. Ultralytics a Ultralytics lancé YOLO26, un modèle de nouvelle génération qui redéfinit les normes établies par ses prédécesseurs.

YOLO26 introduit une conception de bout en bout NMS, éliminant ainsi le besoin d'un post-traitement par suppression non maximale. Il en résulte des pipelines de déploiement plus simples et une inférence plus rapide. De plus, YOLO26 supprime la perte focale de distribution (DFL) pour une meilleure compatibilité avec les périphériques et utilise le nouvel optimiseur MuSGD, inspiré des innovations en matière de formation LLM, afin de garantir une convergence stable.

Pour les développeurs à la recherche des meilleures performances possibles, la migration vers YOLO26 est vivement recommandée. Il offre CPU jusqu'à 43 % plus rapide que les générations précédentes, ce qui en fait le choix idéal pour les applications d'IA de pointe modernes.

En savoir plus sur YOLO26

Conclusion

YOLOv5 EfficientDet ont tous deux gagné leur place au panthéon de la vision par ordinateur. EfficientDet a démontré la puissance du redimensionnement composé, tandis que YOLOv5 que des performances élevées pouvaient être accessibles et conviviales.

Cependant, pour les applications pratiques en 2026, Ultralytics offre un avantage distinct. La combinaison d'une maintenance active, d'une plateforme unifiée pour l'annotation et la formation des données, et d'une innovation architecturale continue fait des modèles tels que YOLOv5et le très avancé YOLO26le choix préféré des professionnels.

Pour ceux qui souhaitent découvrir d'autres architectures modernes, nous vous invitons à consulter les comparaisons avec YOLO11 ou RT-DETR pour bien comprendre l'éventail des outils disponibles.


Commentaires