Passer au contenu

EfficientDet vs YOLOv6.0 : une analyse approfondie des architectures de détection d'objets

Le choix du modèle de détection d'objets approprié consiste souvent à trouver le juste équilibre entre précision, latence et contraintes de déploiement. Cette comparaison explore deux étapes importantes dans l'histoire de la vision par ordinateur : EfficientDet, l'architecture évolutive Google qui a redéfini l'efficacité des paramètres en 2019, et YOLOv6.YOLOv6, le détecteur de qualité industrielle de Meituan optimisé pour GPU à haut débit en 2023.

Comparaison des métriques de performance

Le tableau suivant met en évidence les différences de performances entre les deux architectures. Alors qu'EfficientDet se concentre sur l'efficacité des paramètres (taille de modèle plus petite pour une précision donnée), YOLOv6. YOLOv6 privilégie la vitesse d'inférence sur les accélérateurs matériels tels que les GPU.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet : évolutif et efficace en termes de paramètres

EfficientDet a été introduit par l'équipe Google afin de relever le défi consistant à adapter efficacement les modèles de détection d'objets. Contrairement aux modèles précédents qui se contentaient d'approfondir ou d'élargir les réseaux, EfficientDet a introduit une méthode d'adaptation composite qui adapte uniformément la résolution, la profondeur et la largeur.

Principales caractéristiques architecturales

  • BiFPN (réseau pyramidal bidirectionnel pondéré) : EfficientDet crée un chemin de fusion de caractéristiques complexe. Contrairement à un FPN standard, le BiFPN permet une fusion multi-échelle facile des caractéristiques en introduisant des pondérations apprenables pour différentes caractéristiques d'entrée, garantissant ainsi que le réseau donne la priorité aux informations les plus importantes.
  • EfficientNet Backbone : il utilise EfficientNet comme base, qui est hautement optimisé pour les opérations en virgule flottante (FLOP) et le nombre de paramètres.
  • Mise à l'échelle composée : un simple coefficient $\phi$ contrôle simultanément la mise à l'échelle du réseau principal, du BiFPN et des réseaux de classes/boîtes.

Avertissement concernant la complexité

Bien que le BiFPN soit mathématiquement élégant et efficace en termes de paramètres, ses modèles d'accès à la mémoire irréguliers peuvent rendre son optimisation plus difficile sur certains accélérateurs matériels par rapport aux blocs convolutifs simples que l'on trouve dans YOLO .

Métadonnées :

En savoir plus sur EfficientDet

YOLOv6.0 : le démon de la vitesse industrielle

Lancé par Meituan en 2023, YOLOv6. YOLOv6(souvent appelé « Full-Scale Reloading ») a été spécialement conçu pour les applications industrielles. Les auteurs ont privilégié la vitesse d'inférence réelle sur les GPU plutôt que les FLOP théoriques, ce qui a donné naissance à un modèle qui domine dans les scénarios à haut débit tels que l'analyse vidéo.

Principales caractéristiques architecturales

  • RepBi-PAN : cette structure de cou mise à jour utilise des blocs de type RepVGG. Pendant l'entraînement, ces blocs ont des topologies à branches multiples pour un meilleur flux de gradient. Pendant l'inférence, ils sont structurellement reparamétrés en une seule convolution 3x3, ce qui réduit considérablement la latence.
  • Formation assistée par ancrage (AAT) : bien que YOLOv6 fondamentalement un détecteur sans ancrage, la version 3.0 a introduit une branche auxiliaire basée sur l'ancrage pendant la formation afin de stabiliser la convergence et d'améliorer la précision sans affecter la vitesse d'inférence.
  • Tête découplée : les tâches de classification et de régression sont séparées en différentes branches, un choix de conception qui est devenu la norme dans les détecteurs modernes afin de résoudre le conflit entre ces deux objectifs.

Métadonnées :

  • Auteurs : Chuyi Li, Lulu Li, Yifei Geng, et al.
  • Organisation :Meituan
  • Date : 13 janvier 2023
  • Liens :Arxiv | GitHub

En savoir plus sur YOLOv6

Analyse comparative

Latence et débit

YOLOv6.YOLOv6 est nettement plus rapide sur GPU . Comme le montre le tableau, YOLOv6.YOLOv6 atteint un mAP 52,8 % avec une TensorRT de seulement 8,95 ms. En revanche, EfficientDet-d6 atteint un mAP similaire de 52,6 %, mAP nécessite 89,29 ms, soit un temps pratiquement dix fois plus long. Cela fait de YOLOv6 choix incontestable pour les applications nécessitant un traitement en temps réel sur les appareils NVIDIA ou Jetson.

Efficacité des paramètres

EfficientDet excelle dans les environnements où le stockage est le principal goulot d'étranglement. EfficientDet-d0 offre un mAP respectable de 34,6 % mAP seulement 3,9 millions de paramètres. Ce chiffre est inférieur à celui de YOLOv6 plus petite YOLOv6 . Pour la recherche universitaire ou les environnements de stockage extrêmement limités (par exemple, l'intégration directe d'un modèle dans un petit package d'application mobile), la faible empreinte d'EfficientDet reste pertinente.

Entraînement et convivialité

EfficientDet s'appuie sur l'ancien écosystème TensorFlow , qui peut être difficile à intégrer dans les workflows modernes PyTorch. L'entraînement implique souvent un réglage complexe des hyperparamètres pour la mise à l'échelle composée. YOLOv6. YOLOv6 offre une recette d'entraînement plus moderne, mais se concentre principalement sur la détection d'objets, sans prendre en charge nativement d'autres tâches telles que la segmentation ou l'estimation de la pose dans sa version de base.

L'avantage Ultralytics

Bien que l'étude de ces architectures fournisse des informations précieuses, le développement moderne nécessite une plateforme holistique. Ultralytics un écosystème complet qui supplante les architectures de modèles individuels en se concentrant sur l'ensemble du cycle de vie de l'apprentissage automatique.

Pourquoi passer à Ultralytics?

  • Une polyvalence inégalée : contrairement à EfficientDet et YOLOv6 sont principalement des détecteurs d'objets, Ultralytics prennent en charge de manière native la segmentation d'instances, l'estimation de pose, les boîtes englobantes orientées (OBB) et la classification.
  • Facilité d'utilisation : une Python cohérente vous permet de passer d'une génération de modèle à une autre (par exemple, de YOLO11 YOLO26) en modifiant une seule chaîne de caractères.
  • Efficacité mémoire : Ultralytics sont optimisés pour réduire l'utilisation de la mémoire VRAM pendant l'entraînement, ce qui permet d'utiliser des lots plus volumineux sur les GPU grand public par rapport aux architectures gourmandes en mémoire d'EfficientDet.

Découvrez YOLO26 : la nouvelle norme

Pour les développeurs à la recherche de la technologie la plus avancée, YOLO26 représente le summum en matière d'efficacité et de performances. Lancé en janvier 2026, il pallie les limites d'EfficientDet (vitesse) et de YOLOv6 CPU ).

YOLO26 : avancées majeures

  • NMS de bout en bout : en éliminant la suppression non maximale (NMS), YOLO26 simplifie la logique de déploiement et réduit la variance de latence d'inférence.
  • Optimiseur MuSGD : inspiré de la formation LLM, cet optimiseur hybride stabilise la formation et accélère la convergence.
  • Optimisation des bords : grâce à la suppression de la perte focale de distribution (DFL) et à des ajustements architecturaux spécifiques, YOLO26 est jusqu'à 43 % plus rapide en termes d' inférence CPU par rapport aux générations précédentes, ce qui le rend supérieur pour les déploiements Raspberry Pi et mobiles où EfficientDet rencontre souvent des difficultés.
  • Fonctions de perte avancées : l'intégration de ProgLoss et STAL améliore considérablement la détection des petits objets, une exigence essentielle pour l'imagerie par drone et les capteurs IoT.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

En savoir plus sur YOLO26

Recommandations de cas d'utilisation

  • Choisissez EfficientDet si : vous menez des recherches universitaires sur la mise à l'échelle de la fusion des caractéristiques ou si vous travaillez avec TensorFlow hérités où la taille du poids du modèle (Mo) est une contrainte stricte.
  • Choisissez YOLOv6. YOLOv6 si : vous déployez strictement sur NVIDIA (comme T4 ou A10) et que le débit brut (FPS) pour la détection d'objets standard est votre seul indicateur.
  • Choisissez Ultralytics si : vous avez besoin d'une solution prête à l'emploi qui équilibreGPU , ne nécessite aucun post-traitement complexe (NMS), doit effectuer des tâches allant au-delà de la simple détection (comme la segmentation ou l'OBB) ou exige un flux de travail de formation simplifié.

Pour en savoir plus sur les détecteurs d'objets modernes, nous vous invitons à lire nos comparaisons entre YOLOv8 EfficientDet ou les capacités des transformateurs de détection en temps réel (RT-DETR).


Commentaires