Passer au contenu

EfficientDet vs YOLOv10: analyse de l'évolution des modèles de détection d'objets

Dans le domaine en pleine évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de détection d'objets pour trouver le juste équilibre entre précision, latence et efficacité de calcul. Ce guide technique complet compare deux modèles très influents : EfficientDet Google et YOLOv10 de l'université Tsinghua. YOLOv10de l'université de Tsinghua. Si ces deux modèles représentent des avancées significatives en matière de détection d'objets, ils abordent la conception architecturale et l'optimisation des modèles sous des angles très différents.

Nous explorerons leurs architectures de base, examinerons les benchmarks de performance sur des ensembles de données standard tels que COCO, et discuterons de leur intégration dans les pipelines d'apprentissage automatique modernes, en soulignant tout particulièrement les avantages de Ultralytics complet Ultralytics .

EfficientDet : le pionnier du redimensionnement des composés

Lancé fin 2019, EfficientDet a établi une nouvelle référence en matière de détection d'objets évolutive et hautement précise en introduisant une approche fondée sur des principes pour l'évolutivité des dimensions du réseau.

Principales innovations et architecture

EfficientDet s'appuie sur l'infrastructure EfficientNet et exploite un nouveau réseau pyramidal bidirectionnel (BiFPN). Contrairement aux réseaux pyramidaux traditionnels (FPN) qui additionnent les caractéristiques sans distinguer leur importance, le BiFPN utilise des poids apprenables pour fusionner des caractéristiques à plusieurs échelles. Cela permet au réseau d'apprendre efficacement quelles caractéristiques de résolution contribuent le plus à la prédiction finale. De plus, EfficientDet utilise une méthode de mise à l'échelle composite qui adapte simultanément et uniformément la résolution, la profondeur et la largeur de la structure, du réseau de caractéristiques et des réseaux de prédiction de boîte/classe.

Bien qu'EfficientDet reste un choix solide pour les systèmes hérités profondément intégrés aux anciens TensorFlow , il nécessite une mémoire considérable pendant l'entraînement et repose sur un écosystème plus ancien qui peut s'avérer lourd par rapport aux frameworks modernes et dynamiques.

En savoir plus sur EfficientDet

YOLOv10: l'innovateur NMS

Sorti mi-2024, YOLOv10 a YOLOv10 changé le paradigme de la détection d'objets en temps réel en éliminant le besoin de suppression non maximale (NMS) pendant le post-traitement, réduisant ainsi considérablement la latence d'inférence.

Principales innovations et architecture

YOLOv10 une stratégie cohérente à double affectation pour un entraînement NMS. En utilisant à la fois des affectations d'étiquettes un-à-plusieurs et un-à-un pendant l'entraînement, le réseau apprend à produire des cadres de sélection uniques sans avoir recours au NMS filtrer les doublons. Cette conception de modèle holistique axée sur l'efficacité et la précision réduit la redondance informatique, ce qui en fait un excellent candidat pour les applications de calcul en périphérie et de streaming vidéo à faible latence. Il s'intègre de manière transparente dans Ultralytics , offrant aux développeurs l'accès à une Python extrêmement simple.

En savoir plus sur YOLOv10

Impact NMS

En supprimant NMS , YOLOv10 des vitesses d'inférence constantes, quel que soit le nombre d'objets détectés dans une scène, éliminant ainsi les pics de latence souvent observés dans les applications de vision par ordinateur très sollicitées.

Comparaison des performances : précision, rapidité et efficacité

Lors du déploiement de modèles dans des scénarios réels, les développeurs doivent mettre en balance la précision moyenne (mAP) avec le nombre de paramètres et les opérations de calcul (FLOP). Le tableau ci-dessous détaille ces mesures pour les différentes variantes de mise à l'échelle des deux modèles.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Remarque : la variante YOLOv10n nécessite beaucoup moins de paramètres (2,3 millions) et atteint TensorRT nettement supérieures (1,56 ms) par rapport aux premières itérations d'EfficientDet, ce qui la rend beaucoup plus viable pour l'inférence en temps réel en production.

Pourquoi choisir Ultralytics le déploiement de modèles ?

Bien que ces deux modèles aient une importance historique et structurelle, leur intégration dans les pipelines modernes peut s'avérer difficile. C'est là que la Ultralytics prend tout son sens. En fournissant un écosystème unifié, Ultralytics l'ensemble du cycle de vie, de l'annotation des données au déploiement.

  1. Facilité d'utilisation : lePython Ultralytics offre une interface unique pour l'entraînement, la validation et l'exportation des modèles, remplaçant des centaines de lignes de code standard par des commandes concises.
  2. Écosystème et polyvalence : alors qu'EfficientDet est fortement spécialisé dans la détection,YOLO Ultralytics s'étendent naturellement à la segmentation d'instances, à l'estimation de pose, aux boîtes englobantes orientées (OBB) et à la classification.
  3. Efficacité de l'entraînement : grâce à des techniques de pointe telles que le traitement par lots automatique et l'entraînement distribué, Ultralytics s'entraînent plus rapidement et consomment beaucoup moins CUDA que TF lourdes à transformateurs ou TF anciennes TF à branches multiples.

Exemple de code : Formation YOLOv10

Le déploiement YOLOv10 Ultralytics incroyablement simple. L'extrait de code suivant montre comment initialiser, entraîner et évaluer un YOLOv10 entièrement dans Python .

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

Cas d'utilisation et recommandations

Le choix entre EfficientDet et YOLOv10 des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.

Quand choisir EfficientDet

EfficientDet est un choix judicieux pour :

  • Google et TPU : systèmes profondément intégrés aux API Google Vision ou à TPU , où EfficientDet dispose d'une optimisation native.
  • Recherche sur la mise à l'échelle des composés : analyse comparative académique axée sur l'étude des effets d'une mise à l'échelle équilibrée de la profondeur, de la largeur et de la résolution du réseau.
  • Déploiement mobile via TFLite: projets qui nécessitent spécifiquement l'exportation TensorFlow pour Android les appareils Linux embarqués.

Quand choisir YOLOv10

YOLOv10 recommandé pour :

  • Détection en temps réelNMS: applications bénéficiant d'une détection de bout en bout sans suppression non maximale, réduisant ainsi la complexité du déploiement.
  • Compromis équilibré entre vitesse et précision : projets nécessitant un équilibre solide entre la vitesse d'inférence et la précision de détection à différentes échelles de modèle.
  • Applications à latence constante : scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, tels que la robotique ou les systèmes autonomes.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

L'avenir est là : découvrez Ultralytics

Alors que YOLOv10 une conception révolutionnaire NMS, la technologie a évolué. Lancé en janvier 2026, Ultralytics représente la technologie de pointe définitive en matière d'IA visuelle. Il réunit les meilleurs aspects des architectures précédentes, comme le YOLO11 et les capacités multitâches de RT-DETR , en un seul moteur hautement optimisé.

L'avantage YOLO26

Si vous démarrez un nouveau projet, nous vous recommandons vivement de passer à YOLO26. Il offre une flexibilité et une facilité d'utilisation inégalées via la Ultralytics .

Principales avancées dans YOLO26 :

  • Conception de bout en bout NMS: s'appuyant sur les bases posées par YOLOv10, YOLO26 est nativement de bout en bout, simplifiant la logique de déploiement au strict minimum.
  • CPU jusqu'à 43 % plus rapide : grâce à la suppression de la perte focale de distribution (DFL), YOLO26 réduit considérablement la charge de calcul, ce qui en fait le leader incontesté des appareils d'IA de pointe.
  • Optimiseur MuSGD : YOLO26 emprunte les innovations issues de l'entraînement des grands modèles linguistiques (LLM). En combinant la stabilité du SGD la vitesse du Muon, il converge plus rapidement et de manière plus fiable que tous ses prédécesseurs.
  • ProgLoss + STAL : des formules de perte supérieures résolvent efficacement les problèmes de longue date liés à la détection des petits objets, un domaine dans lequel EfficientDet rencontrait traditionnellement des difficultés.

En savoir plus sur YOLO26

Conclusion : adapter les modèles aux cas d'utilisation

Le choix entre ces réseaux dépend en fin de compte de vos contraintes de déploiement :

  • EfficientDet reste un sujet d'intérêt académique en matière de mise à l'échelle des composés et convient aux chercheurs qui maintiennent des TensorFlow existants, où la taille du poids du modèle (sur disque) est plus critique que la vitesse d'exécution.
  • YOLOv10 est phénoménal pour les applications exigeant une latence ultra-faible, telles que le suivi multi-objets à grande vitesse et la surveillance du trafic, grâce à son architecture pionnière NMS.
  • YOLO26, cependant, est la recommandation ultime pour les projets modernes de vision par ordinateur, offrant le meilleur équilibre possible entre précision, empreinte mémoire minimale et polyvalence multitâche, le tout soutenu par le solide Ultralytics .

Commentaires