Link to this sectionEfficientDet vs YOLO11#

Le choix d'une architecture de réseau neuronal optimale est le fondement de toute application de vision par ordinateur réussie. Ce guide complet fournit une comparaison technique approfondie entre l'EfficientDet de Google et Ultralytics YOLO11, en analysant leurs différences architecturales, leurs métriques de performance et les scénarios de déploiement idéaux.

Que tu vises une latence de l'ordre de la milliseconde sur des appareils d'IA en périphérie (edge AI) ou que tu aies besoin d'une précision évolutive pour l'inférence dans le cloud, il est crucial de comprendre les nuances de ces modèles.

Link to this sectionProfils des modèles et détails techniques#

Comprendre la lignée et la philosophie de conception sous-jacente de chaque architecture permet de mieux situer leurs performances dans les tâches réelles de détection d'objets.

Link to this sectionEfficientDet#

Développé par les chercheurs de Google Brain, EfficientDet a introduit une approche rigoureuse pour la mise à l'échelle des réseaux de détection d'objets, accompagnée du nouveau BiFPN (Bidirectional Feature Pyramid Network).

Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
Organisation : Google
Date : 2019-11-20
Arxiv : https://arxiv.org/abs/1911.09070
GitHub : https://github.com/google/automl/tree/master/efficientdet
Docs : https://github.com/google/automl/tree/master/efficientdet#readme

En savoir plus sur EfficientDet

Link to this sectionYOLO11#

YOLO11 représente une évolution significative au sein de l'écosystème Ultralytics, repoussant les limites de la performance en temps réel, de l'efficacité des paramètres et de l'apprentissage multi-tâches.

Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 2024-09-27
GitHub : https://github.com/ultralytics/ultralytics
Documentation : https://docs.ultralytics.com/models/yolo11/

En savoir plus sur YOLO11

Link to this sectionComparaison architecturale#

Les différences architecturales entre ces deux modèles soulignent la divergence des stratégies de conception au fil des années.

EfficientDet s'appuie sur le backbone EfficientNet et introduit le BiFPN, qui permet une fusion des caractéristiques multi-échelles descendante et ascendante. Il utilise une méthode de mise à l'échelle composée qui ajuste uniformément la résolution, la profondeur et la largeur pour l'ensemble du backbone, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes simultanément. Bien qu'efficace pour maximiser la précision moyenne (mAP), le routage complexe du BiFPN peut parfois créer un goulot d'étranglement pour la bande passante mémoire lors de l'inférence.

YOLO11, en revanche, utilise un module C3k2 optimisé et une tête de détection avancée sans ancres (anchor-free). Cette approche simplifiée minimise la surcharge lors de l'extraction des caractéristiques. Ultralytics a conçu YOLO11 pour maximiser l'utilisation du matériel GPU, ce qui se traduit par des besoins en mémoire nettement inférieurs lors de l'entraînement et de l'inférence par rapport aux architectures plus anciennes ou aux modèles Transformer lourds.

Polyvalence multi-tâches

Alors qu'EfficientDet est strictement un détecteur d'objets, YOLO11 affiche une polyvalence extrême. Une architecture YOLO11 unique prend nativement en charge la segmentation d'instances, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB).

Link to this sectionBenchmarks de performance#

Le tableau ci-dessous compare les performances des deux familles de modèles à différentes échelles sur le jeu de données COCO.

Modèle	taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20,7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11,3	56,9	194.9

Link to this sectionAnalyse équilibrée : forces et faiblesses#

Accélération GPU : YOLO11 domine dans les environnements GPU. Par exemple, YOLO11m fournit un mAP de 51,5 % en seulement 4,7 ms sur un GPU T4 utilisant TensorRT. Pour atteindre une précision comparable, EfficientDet-d5 prend 67,86 ms, soit plus de 14 fois plus lentement. Cela souligne l'équilibre de performance supérieur des modèles Ultralytics pour les applications en temps réel.

Environnements CPU : EfficientDet présente des vitesses d'inférence CPU hautement optimisées dans ses variantes les plus petites (comme d0 et d1) en utilisant ONNX. Cependant, sa précision diminue rapidement sans engendrer d'énormes pénalités de latence GPU dans les variantes plus grandes comme d7.

Link to this sectionMéthodologie d'entraînement et écosystème#

L'expérience du développeur est souvent aussi cruciale que les capacités théoriques du modèle. C'est là que l'écosystème Ultralytics brille.

EfficientDet repose fortement sur l'écosystème hérité TensorFlow et sur des bibliothèques AutoML complexes. La configuration d'un pipeline d'entraînement personnalisé implique une courbe d'apprentissage abrupte, une gestion complexe des dépendances et une configuration manuelle des ancres et des fonctions de perte (loss functions).

À l'inverse, Ultralytics offre une facilité d'utilisation inégalée. Soutenu par un écosystème PyTorch bien entretenu, l'entraînement d'un modèle YOLO ne nécessite que quelques lignes de code. Le framework gère automatiquement l'ajustement des hyperparamètres, les augmentations de données avancées et la planification optimale du taux d'apprentissage, et ce, dès le départ.

Link to this sectionExemple de code : Pour bien démarrer avec Ultralytics#

Ce snippet robuste, prêt pour la production, montre à quel point l'entraînement et l'inférence sont simples au sein de l'API Python.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Link to this sectionCas d'utilisation idéaux#

Quand utiliser EfficientDet : EfficientDet reste un choix viable pour les environnements de recherche fortement ancrés dans les pipelines TensorFlow ou pour des contraintes spécifiques liées au CPU où les architectures anciennes comme d0 fonctionnent correctement.

Quand utiliser YOLO11 : YOLO11 est le choix définitif pour les déploiements en entreprise modernes. Sa vitesse exceptionnelle le rend parfait pour les véhicules autonomes, l'analyse sportive en temps réel et la détection de défauts de fabrication à haut débit. De plus, sa consommation mémoire réduite permet un déploiement flexible sur du matériel aux ressources limitées comme le NVIDIA Jetson.

Link to this sectionRegard vers l'avenir : La mise à niveau YOLO26#

Bien que YOLO11 soit exceptionnellement performant, les développeurs lançant de nouveaux projets devraient évaluer d'autres architectures Ultralytics comme le YOLOv8 éprouvé ou le tout nouveau YOLO26. Sorti début 2026, YOLO26 s'appuie sur les bases de YOLO11 et introduit plusieurs innovations révolutionnaires :

Conception de bout en bout sans NMS : En s'appuyant sur l'héritage de YOLOv10, YOLO26 élimine complètement la suppression non-maximale (NMS) lors du post-traitement, réduisant ainsi la latence et simplifiant les pipelines de déploiement.
Optimiseur MuSGD : Un optimiseur hybride combinant SGD standard et Muon (inspiré par l'entraînement des grands modèles de langage), améliorant radicalement la stabilité de l'entraînement.
Jusqu'à 43 % d'inférence CPU plus rapide : Des optimisations spécifiques rendent YOLO26 incroyablement puissant sur les appareils en périphérie dépourvus de GPU discrets.
ProgLoss + STAL : Des fonctions de perte avancées qui améliorent considérablement la détection de petits objets, cruciale pour l'imagerie aérienne et la robotique.

Explore le paysage plus large des architectures de vision, y compris les détecteurs basés sur les Transformer comme RT-DETR, dans notre documentation Ultralytics complète.

Contributeurs

GLglenn-jocher¹³ PDpderrenger¹

Créé 27 janv. 2025Mis à jour il y a 3 semaines