Passer au contenu

EfficientDet vs YOLOv10: analyse de l'évolution des modèles de détection d'objets

Dans le domaine en pleine évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de détection d'objets pour trouver le juste équilibre entre précision, latence et efficacité de calcul. Ce guide technique complet compare deux modèles très influents : EfficientDet Google et YOLOv10 de l'université Tsinghua. YOLOv10de l'université de Tsinghua. Si ces deux modèles représentent des avancées significatives en matière de détection d'objets, ils abordent la conception architecturale et l'optimisation des modèles sous des angles très différents.

Nous explorerons leurs architectures de base, examinerons les benchmarks de performance sur des ensembles de données standard tels que COCO, et discuterons de leur intégration dans les pipelines d'apprentissage automatique modernes, en soulignant tout particulièrement les avantages de Ultralytics complet Ultralytics .

EfficientDet : le pionnier du redimensionnement des composés

Lancé fin 2019, EfficientDet a établi une nouvelle référence en matière de détection d'objets évolutive et hautement précise en introduisant une approche fondée sur des principes pour l'évolutivité des dimensions du réseau.

Principales innovations et architecture

EfficientDet s'appuie sur l'infrastructure EfficientNet et exploite un nouveau réseau pyramidal bidirectionnel (BiFPN). Contrairement aux réseaux pyramidaux traditionnels (FPN) qui additionnent les caractéristiques sans distinguer leur importance, le BiFPN utilise des poids apprenables pour fusionner des caractéristiques à plusieurs échelles. Cela permet au réseau d'apprendre efficacement quelles caractéristiques de résolution contribuent le plus à la prédiction finale. De plus, EfficientDet utilise une méthode de mise à l'échelle composite qui adapte simultanément et uniformément la résolution, la profondeur et la largeur de la structure, du réseau de caractéristiques et des réseaux de prédiction de boîte/classe.

Bien qu'EfficientDet reste un choix solide pour les systèmes hérités profondément intégrés aux anciens TensorFlow , il nécessite une mémoire considérable pendant l'entraînement et repose sur un écosystème plus ancien qui peut s'avérer lourd par rapport aux frameworks modernes et dynamiques.

En savoir plus sur EfficientDet

YOLOv10: l'innovateur NMS

Sorti mi-2024, YOLOv10 a YOLOv10 changé le paradigme de la détection d'objets en temps réel en éliminant le besoin de suppression non maximale (NMS) pendant le post-traitement, réduisant ainsi considérablement la latence d'inférence.

Principales innovations et architecture

YOLOv10 une stratégie cohérente à double affectation pour un entraînement NMS. En utilisant à la fois des affectations d'étiquettes un-à-plusieurs et un-à-un pendant l'entraînement, le réseau apprend à produire des cadres de sélection uniques sans avoir recours au NMS filtrer les doublons. Cette conception de modèle holistique axée sur l'efficacité et la précision réduit la redondance informatique, ce qui en fait un excellent candidat pour les applications de calcul en périphérie et de streaming vidéo à faible latence. Il s'intègre de manière transparente dans Ultralytics , offrant aux développeurs l'accès à une Python extrêmement simple.

En savoir plus sur YOLOv10

Impact NMS

En supprimant l'étape NMS, YOLOv10 garantit des vitesses d'inférence constantes, quel que soit le nombre d'objets détectés dans une scène, éliminant les pics de latence souvent observés dans les applications de vision par ordinateur encombrées.

Comparaison des performances : précision, rapidité et efficacité

Lors du déploiement de modèles dans des scénarios réels, les développeurs doivent mettre en balance la précision moyenne (mAP) avec le nombre de paramètres et les opérations de calcul (FLOP). Le tableau ci-dessous détaille ces mesures pour les différentes variantes de mise à l'échelle des deux modèles.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Remarque : la variante YOLOv10n nécessite beaucoup moins de paramètres (2,3 millions) et atteint TensorRT nettement supérieures (1,56 ms) par rapport aux premières itérations d'EfficientDet, ce qui la rend beaucoup plus viable pour l'inférence en temps réel en production.

Pourquoi choisir Ultralytics le déploiement de modèles ?

Bien que ces deux modèles aient une importance historique et structurelle, leur intégration dans les pipelines modernes peut s'avérer difficile. C'est là que la Ultralytics prend tout son sens. En fournissant un écosystème unifié, Ultralytics l'ensemble du cycle de vie, de l'annotation des données au déploiement.

  1. Facilité d'utilisation : Le package Python Ultralytics offre une interface unique pour l'entraînement, la validation et l'exportation de modèles, remplaçant des centaines de lignes de code passe-partout par des commandes concises.
  2. Écosystème et polyvalence : Alors qu'EfficientDet est fortement spécialisé pour la detect, les modèles Ultralytics YOLO s'étendent naturellement à la segmentation d'instances, à l'estimation de pose, aux boîtes englobantes orientées (obb) et à la classification.
  3. Efficacité de l'entraînement : En tirant parti de techniques de pointe comme l'auto-batching et l'entraînement distribué, les modèles Ultralytics s'entraînent plus rapidement et consomment considérablement moins de mémoire CUDA que les transformeurs lourds ou les anciennes architectures TF multi-branches.

Exemple de code : Entraînement de YOLOv10

Le déploiement de YOLOv10 avec Ultralytics est incroyablement simple. L'extrait de code suivant montre comment initialiser, entraîner et évaluer un réseau YOLOv10 entièrement au sein de l'API Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

Cas d'utilisation et recommandations

Le choix entre EfficientDet et YOLOv10 dépend de vos exigences spécifiques de projet, de vos contraintes de déploiement et de vos préférences d'écosystème.

Quand choisir EfficientDet

EfficientDet est un excellent choix pour :

  • Google et TPU : systèmes profondément intégrés aux API Google Vision ou à TPU , où EfficientDet dispose d'une optimisation native.
  • Recherche sur la mise à l'échelle composée : Évaluation comparative académique axée sur l'étude des effets de la mise à l'échelle équilibrée de la profondeur, de la largeur et de la résolution du réseau.
  • Déploiement mobile via TFLite : Projets nécessitant spécifiquement l'exportation TensorFlow Lite pour les appareils Android ou Linux embarqués.

Quand choisir YOLOv10

YOLOv10 recommandé pour :

  • Détection en temps réel sans NMS : Applications qui bénéficient d'une détection de bout en bout sans Non-Maximum Suppression, réduisant ainsi la complexité du déploiement.
  • Compromis équilibrés vitesse-précision: Projets nécessitant un équilibre solide entre la vitesse d'inférence et la précision de détection sur diverses échelles de modèles.
  • Applications à latence constante : Scénarios de déploiement où des temps d'inférence prévisibles sont critiques, tels que la robotique ou les systèmes autonomes.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • Déploiement Edge sans NMS : Applications nécessitant une inférence cohérente et à faible latence, sans la complexité du post-traitement de la Non-Maximum Suppression.
  • Environnements uniquement CPU : Les appareils sans accélération GPU dédiée, où l'inférence CPU de YOLO26, jusqu'à 43 % plus rapide, offre un avantage décisif.
  • Détection de petits objets: Scénarios difficiles comme l'imagerie aérienne par drone ou l'analyse de capteurs IoT où ProgLoss et STAL augmentent significativement la précision sur les objets minuscules.

L'avenir est là : découvrez Ultralytics

Alors que YOLOv10 une conception révolutionnaire NMS, la technologie a évolué. Lancé en janvier 2026, Ultralytics représente la technologie de pointe définitive en matière d'IA visuelle. Il réunit les meilleurs aspects des architectures précédentes, comme le YOLO11 et les capacités multitâches de RT-DETR , en un seul moteur hautement optimisé.

L'avantage YOLO26

Si vous démarrez un nouveau projet, nous vous recommandons vivement de passer à YOLO26. Il offre une flexibilité et une facilité d'utilisation inégalées via la Ultralytics .

Principales avancées dans YOLO26 :

  • Conception de bout en bout sans NMS : S'appuyant sur les bases posées par YOLOv10, YOLO26 est nativement de bout en bout, simplifiant la logique de déploiement au strict minimum.
  • Jusqu'à 43 % plus rapide pour l'inférence CPU : Avec la suppression de la Distribution Focal Loss (DFL), YOLO26 réduit drastiquement la charge de calcul, en faisant le roi incontesté des appareils d'IA embarquée.
  • Optimiseur MuSGD : YOLO26 emprunte des innovations de l'entraînement des grands modèles linguistiques (LLM). En fusionnant la stabilité du SGD avec la vitesse de Muon, il converge plus rapidement et de manière plus fiable que tout prédécesseur.
  • ProgLoss + STAL: Des formulations de perte supérieures résolvent efficacement les problèmes de longue date liés à la détection de petits objets, un domaine où EfficientDet rencontrait traditionnellement des difficultés.

En savoir plus sur YOLO26

Conclusion : Adéquation des modèles aux cas d'utilisation

Le choix entre ces réseaux dépend finalement de vos contraintes de déploiement :

  • EfficientDet reste un sujet d'intérêt académique concernant la mise à l'échelle composée et convient aux chercheurs qui maintiennent des systèmes TensorFlow existants où la taille du poids du modèle (sur disque) est plus critique que la vitesse d'exécution.
  • YOLOv10 est phénoménal pour les applications exigeant une latence ultra-faible, telles que le suivi multi-objets à grande vitesse et la surveillance du trafic, grâce à son architecture pionnière sans NMS.
  • YOLO26 est cependant la recommandation ultime pour les projets de vision par ordinateur modernes, offrant le meilleur équilibre de performance absolu en termes de précision, d'empreinte mémoire minimale et de polyvalence multi-tâches, soutenu par l'écosystème robuste d'Ultralytics.

Commentaires