Passer au contenu

EfficientDet vs YOLOv10: l'évolution de la détection d'objets en temps réel

Le paysage de la vision par ordinateur a considérablement évolué entre la sortie d'EfficientDet Google en 2019 et celle de YOLOv10 par l'université Tsinghua YOLOv10 2024. Pour les développeurs et les chercheurs, il est essentiel de comprendre la trajectoire qui a mené des architectures complexes à plusieurs niveaux à des architectures rationalisées de bout en bout afin de choisir l'outil le mieux adapté à la tâche à accomplir. Cette analyse compare la précision traditionnelle d'EfficientDet à l'innovation à faible latence de YOLOv10, tout en soulignant comment les solutions modernes telles que Ultralytics établissent de nouvelles normes pour les environnements de production.

EfficientDet : l'héritage du redimensionnement des composés

Publié par l'équipe Google , EfficientDet a marqué une étape importante dans l'optimisation de l'efficacité des réseaux neuronaux. Il a introduit le concept de « Compound Scaling », qui permet d'ajuster de manière uniforme la résolution, la profondeur et la largeur de la structure du réseau, plutôt que de modifier une seule dimension.

Détails techniques d'EfficientDet :

Au cœur d'EfficientDet se trouve le réseau pyramidal bidirectionnel (BiFPN). Contrairement aux FPN traditionnels qui additionnent les caractéristiques de différentes échelles, le BiFPN permet une fusion complexe et pondérée des caractéristiques, ce qui permet au modèle d'apprendre l'importance des différentes caractéristiques d'entrée. Bien que cette architecture ait atteint une précision moyenne (mAP) de pointe sur COCO à l'époque, les interconnexions complexes des couches BiFPN entraînent une surcharge informatique importante, ce qui ralentit l'inférence, en particulier sur les appareils périphériques, par rapport aux architectures modernes.

YOLOv10: la révolution de bout en bout

YOLOv10, développé par des chercheurs de l'université Tsinghua, résout le principal problème des YOLO précédentes YOLO : la suppression non maximale (NMS). En utilisant une stratégie d'attribution double cohérente pendant l'entraînement, YOLOv10 à prédire un seul cadre optimal pour chaque objet, devenant ainsi un détecteur de bout en bout NMS.

Détails YOLOv10 :

Cette évolution architecturale permet de réduire considérablement la latence d'inférence. Le modèle introduit également une conception holistique axée sur l'efficacité et la précision, utilisant des convolutions à grand noyau et une auto-attention partielle pour améliorer les performances sans le gonflement des paramètres observé dans les anciens modèles.

En savoir plus sur YOLOv10

Comparaison des performances : Vitesse vs Précision

La différence de performances entre ces deux générations de modèles est flagrante, en particulier en ce qui concerne la vitesse d'inférence. Si EfficientDet-d7 offre une grande précision, cela se fait au prix d'une latence importante (plus de 100 ms), tandis que YOLOv10 atteignent une précision similaire ou supérieure en quelques millisecondes.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Analyse architecturale

  1. Post-traitement : EfficientDet s'appuie fortement sur NMS filtrer les boîtes qui se chevauchent. Dans les scènes denses, cette étape de post-traitement devient un CPU , augmentant la latence totale quelle que soit GPU . La conceptionNMS YOLOv10 élimine complètement cette étape.
  2. Utilisation de la mémoire : EfficientDet, en particulier les échelles supérieures telles que d7, consomme beaucoup de VRAM en raison de la structure BiFPN. YOLOv10 optimisé pour réduire l'empreinte mémoire, ce qui le rend plus adapté aux applications d'IA de pointe.
  3. Optimisation : EfficientDet est basé sur TensorFlow peut être complexe à exporter vers des formats tels que ONNX TensorRT par rapport à PyTorch native PyTorch des YOLO modernes.

L'avantage de l'écosystème Ultralytics

Si YOLOv10 des avancées architecturales impressionnantes, son utilisation au sein de Ultralytics amplifie son utilité. Les développeurs sont souvent confrontés à la fragmentation des référentiels universitaires. Ultralytics ce problème en unifiant les modèles sous un seul Python bien entretenu.

Pourquoi choisir l'Ultralytics ?

  • Facilité d'utilisation : passez de YOLOv8 à YOLOv10, YOLO11 et YOLO26 à l'aide d'une seule ligne de code.
  • Efficacité de la formation : les hyperparamètres pré-réglés et la gestion automatique de la taille des lots garantissent une utilisation optimale des ressources.
  • Prêt à être déployé : exportation en un clic vers TFLite, CoreML, OpenVINO et ONNX.
  • Ultralytics : gérez vos ensembles de données en toute transparence, formez vos modèles dans le cloud et déployez-les via la Ultralytics .

Exemple de code

L'exécution d'inférences avec Ultralytics conçue pour être simple et conforme à l'esprit Python. Voici comment charger un YOLOv10 et exécuter une prédiction :

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Recommandation de production : passer à YOLO26

Alors qu'EfficientDet sert de référence historique importante et que YOLOv10 le paradigme NMS, le modèleUltralytics représente le summum de cette évolution pour une utilisation en production.

Sorti en janvier 2026, YOLO26 s'appuie sur la percée NMS de YOLOv10 l'améliore pour une plus grande robustesse dans le monde réel. Il se caractérise par la suppression de la perte focale de distribution (DFL), qui simplifie le graphe du modèle pour faciliter l'exportation et améliorer la compatibilité avec les appareils périphériques à faible consommation d'énergie.

De plus, YOLO26 intègre l'optimiseur MuSGD, un hybride de SGD Muon (inspiré des innovations en matière de formation LLM), garantissant une convergence plus rapide et une formation stable. Grâce à des optimisations telles que ProgLoss et STAL (Shape-aware Task Alignment Loss), YOLO26 offre une détection supérieure des petits objets et est jusqu'à 43 % plus rapide sur CPU que les générations précédentes.

En savoir plus sur YOLO26

Cas d'utilisation concrets

Le choix du modèle approprié dépend de vos contraintes spécifiques :

  • EfficientDet : particulièrement adapté à la recherche universitaire où l'étude de la mise à l'échelle des composés ou des architectures BiFPN est nécessaire. On le trouve également dans les systèmes hérités où le coût de la migration l'emporte sur les avantages en termes de performances des modèles plus récents.
  • YOLOv10 YOLO26 : Le choix idéal pour applications en temps réel.
    • Robotique : la conception NMS réduit la gigue de latence, ce qui est essentiel pour la navigation et l'évitement d'obstacles.
    • Surveillance du trafic : le débit élevé permet de traiter plusieurs flux vidéo sur un seul GPU suivi d'objets.
    • Applications mobiles : grâce à leur faible nombre de paramètres et leur faible consommation de mémoire, ces modèles sont parfaitement adaptés à une utilisation sur Android iOS Android .

Pour les développeurs qui recherchent le meilleur équilibre entre vitesse, précision et facilité de déploiement, la transition vers Ultralytics ou YOLO11 est la voie à suivre.


Commentaires