Passer au contenu

YOLO26 vs EfficientDet : Architecture, performances et cas d'utilisation

Le paysage de la détection d'objets a considérablement évolué au cours de la dernière décennie. Deux architectures notables qui ont façonné ce domaine sont Ultralytics YOLO26 et EfficientDet de Google. Alors qu'EfficientDet a introduit une méthode évolutive et efficace pour gérer les caractéristiques multi-échelles en 2019, YOLO26 représente la pointe de la vision par ordinateur en temps réel en 2026, offrant un traitement de bout en bout et une vitesse supérieure sur les appareils périphériques.

Ce guide fournit une comparaison technique détaillée pour aider les développeurs, les chercheurs et les ingénieurs à choisir le bon modèle pour leurs applications.

Aperçu du modèle

Ultralytics YOLO26

Lancé en janvier 2026, YOLO26 est la dernière itération de la célèbre famille YOLO (You Only Look Once). Il introduit une architecture de bout en bout, nativement sans NMS, qui simplifie les pipelines de déploiement en éliminant le besoin de post-traitement de suppression non-maximale (NMS). Conçu pour une efficacité extrême, il excelle dans les scénarios de calcul en périphérie, offrant des accélérations significatives sur les CPU sans sacrifier la précision.

Auteurs clés : Glenn Jocher et Jing Qiu
Organisation :Ultralytics
Date de publication : 2026-01-14
Licence :AGPL-3.0 (Version Entreprise disponible)

En savoir plus sur YOLO26

Google EfficientDet

EfficientDet a été proposé par l'équipe Google Brain (maintenant Google DeepMind) fin 2019. Il se concentre sur l'efficacité et l'évolutivité, en utilisant une méthode de mise à l'échelle composée qui met à l'échelle uniformément la résolution, la profondeur et la largeur du backbone, du réseau de caractéristiques et du réseau de prédiction. Son innovation principale était le Bi-directional Feature Pyramid Network (BiFPN), qui permet une fusion facile et rapide des caractéristiques multi-échelles.

Auteurs clés : Mingxing Tan, Ruoming Pang et Quoc V. Le
Organisation : Google
Date de publication : 2019-11-20
Licence : Apache 2.0

Comparaison des performances

En comparant ces deux architectures, la différence la plus frappante réside dans la vitesse d'inférence et la complexité de déploiement. Alors qu'EfficientDet a établi des références en matière d'efficacité en 2019, YOLO26 tire parti des optimisations modernes pour le surpasser significativement, en particulier pour l'inférence basée sur le CPU, ce qui est crucial pour le déploiement en périphérie.

Le tableau ci-dessous met en évidence les métriques de performance sur le jeu de données COCO. Notez l'avantage de vitesse substantiel de la série YOLO26.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Contexte de benchmarking

La métrique Speed CPU ONNX est particulièrement importante pour les applications réelles sur du matériel standard. YOLO26n atteint une latence remarquable de 38,9 ms, le rendant viable pour le traitement vidéo en temps réel sur des appareils non accélérés. Inversement, les itérations supérieures d'EfficientDet souffrent d'une latence élevée, les rendant moins adaptées au traitement de flux en direct.

Plongée en profondeur dans l'architecture

Innovations de YOLO26

YOLO26 marque une rupture avec la logique de détection traditionnelle basée sur des ancres, présente dans les modèles précédents.

  • Logique de bout en bout sans NMS : Les détecteurs traditionnels comme EfficientDet nécessitent une suppression non maximale (NMS) pour filtrer les boîtes englobantes qui se chevauchent. Cette étape est coûteuse en calcul et difficile à optimiser sur les accélérateurs matériels. YOLO26 l'élimine entièrement, prédisant directement l'ensemble exact d'objets.
  • Optimiseur MuSGD : Inspiré par l'entraînement des grands modèles de langage (LLM), YOLO26 utilise un optimiseur hybride combinant SGD et Muon. Cela se traduit par une dynamique d'entraînement plus stable et une convergence plus rapide lors de l'entraînement de modèles personnalisés.
  • Suppression du DFL : En supprimant la Distribution Focal Loss (DFL), l'architecture du modèle est simplifiée. Cette réduction de complexité se traduit directement par des vitesses d'inférence plus rapides et une exportation plus facile vers des formats comme ONNX et TensorRT.
  • ProgLoss + STAL : L'introduction de l'équilibrage progressif des pertes (Progressive Loss Balancing) et de l'assignation d'étiquettes sensible aux petites cibles (Small-Target-Aware Label Assignment) améliore significativement les performances en matière de détection de petits objets, un défi historique pour les détecteurs à un seul étage.

Architecture EfficientDet

EfficientDet est basé sur le backbone EfficientNet et introduit le BiFPN (Bi-directional Feature Pyramid Network).

  • Mise à l'échelle composée : EfficientDet met à l'échelle la résolution, la largeur et la profondeur simultanément en utilisant un coefficient composé (phi). Cela permet aux utilisateurs d'échanger la précision contre les ressources de manière systématique, de D0 à D7.
  • BiFPN : Contrairement à un FPN standard, le BiFPN permet à l'information de circuler à la fois de haut en bas et de bas en haut, et il utilise des poids apprenables pour déterminer l'importance des différentes caractéristiques d'entrée.
  • Basé sur des ancres : EfficientDet s'appuie sur un ensemble de boîtes d'ancrage prédéfinies, nécessitant un réglage minutieux des rapports d'aspect et des échelles pour des performances optimales sur les jeux de données personnalisés.

Facilité d'utilisation et écosystème

L'une des différences fondamentales entre l'utilisation de YOLO26 et d'EfficientDet réside dans l'écosystème logiciel qui les entoure.

L'expérience Ultralytics

Ultralytics privilégie la facilité d'utilisation et une API unifiée. Que vous effectuiez de la détection d'objets, de la segmentation d'instances, de l'estimation de pose ou de la détection d'objets orientés (obb), la syntaxe reste cohérente.

  • API Python simple : L'entraînement d'un modèle ne nécessite que quelques lignes de code.
  • Polyvalence : YOLO26 prend en charge plusieurs tâches de manière native. EfficientDet est principalement un détecteur d'objets, bien que des têtes de segmentation puissent être ajoutées avec des implémentations personnalisées.
  • Prêt pour le déploiement : L'écosystème Ultralytics inclut un support intégré pour l'exportation vers CoreML, TFLite, OpenVINO, et plus encore, simplifiant le chemin de la recherche à la production.
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

L'écosystème EfficientDet

EfficientDet est généralement accessible via l'API TensorFlow Object Detection ou diverses implémentations PyTorch. Bien que puissants, ces frameworks nécessitent souvent plus de code passe-partout, des fichiers de configuration complexes et une courbe d'apprentissage plus raide pour les débutants. L'entraînement efficace sur des données personnalisées nécessite souvent un réglage significatif des hyperparamètres par rapport à la facilité d'utilisation "prête à l'emploi" des modèles YOLO.

Recommandations de cas d'utilisation

Quand choisir YOLO26

YOLO26 est le choix idéal pour la plupart des applications de vision par ordinateur modernes, notamment :

  1. Edge Computing : Si vous déployez sur Raspberry Pi, des appareils mobiles (iOS/Android) ou NVIDIA Jetson, l'inférence CPU jusqu'à 43 % plus rapide rend YOLO26 supérieur.
  2. Vidéo en temps réel : Pour les applications nécessitant un FPS élevé, telles que la conduite autonome ou la surveillance de sécurité, la faible latence de YOLO26 est critique.
  3. Tâches complexes : Si votre projet implique non seulement la détection mais aussi l'estimation de pose ou la segmentation, l'utilisation d'un cadre unifié unique réduit les frais généraux de développement.
  4. Prototypage rapide : La communauté active et la documentation exhaustive permettent aux développeurs d'itérer rapidement.

Quand considérer EfficientDet

Bien que généralement plus lent, EfficientDet reste pertinent dans des contextes de recherche spécifiques :

  1. Recherche académique : Si vous étudiez spécifiquement les réseaux pyramidaux de caractéristiques, l'architecture BiFPN reste une référence précieuse.
  2. Systèmes hérités : Les pipelines existants fortement intégrés aux anciennes versions de TensorFlow pourraient trouver plus facile de maintenir un modèle EfficientDet existant plutôt que de migrer.

Conclusion

Alors qu'EfficientDet a introduit des concepts révolutionnaires en matière de fusion de caractéristiques et de mise à l'échelle de modèles, YOLO26 représente la prochaine génération d'IA visuelle. Grâce à sa conception de bout en bout sans NMS, à ses vitesses d'inférence supérieures et à ses exigences de mémoire réduites, YOLO26 offre une solution plus pratique et plus puissante pour les défis actuels de l'IA.

Pour les développeurs souhaitant créer des applications robustes et en temps réel, le flux de travail rationalisé et l'équilibre des performances d'Ultralytics YOLO26 en font la recommandation évidente.

Lectures complémentaires

Découvrez d'autres modèles dans la documentation Ultralytics :

  • YOLO11 : Le modèle de pointe de la génération précédente.
  • YOLOv10 : Le pionnier de l'entraînement sans NMS.
  • RT-DETR : Transformateur de détection en temps réel, une autre excellente option de bout en bout.

Commentaires