Passer au contenu

YOLOv10 EfficientDet : l'évolution de l'efficacité de la détection d'objets

Le paysage de la vision par ordinateur a été défini par la recherche d'un équilibre, plus précisément entre la vitesse d'inférence et la précision de détection. Cette comparaison explore deux étapes importantes de cette histoire : YOLOv10, la percée académique de l'université Tsinghua qui a introduit la détection NMS, et EfficientDet, l'architecture pionnière Google qui a promu l'efficacité évolutive.

Alors qu'EfficientDet a établi des références en 2019 avec sa méthode de mise à l'échelle composée, YOLOv10 2024) représente un changement de paradigme vers la suppression totale des goulots d'étranglement liés au post-traitement. Ce guide analyse leurs architectures, leurs mesures de performance et leur adéquation aux applications modernes d'IA de pointe.

YOLOv10 : Le détecteur en temps réel de bout en bout

Sorti en mai 2024, YOLOv10 une inefficacité de longue date dans la YOLO : le recours à la suppression non maximale (NMS). En éliminant cette étape de post-traitement, YOLOv10 réduit YOLOv10 la latence et simplifie les pipelines de déploiement.

YOLOv10 :

Principales innovations architecturales

La caractéristique distinctive de YOLOv10 sa stratégie d'attribution double cohérente. Pendant l'entraînement, le modèle utilise une tête « one-to-many » pour les signaux de supervision riches et une tête « one-to-one » pour apprendre des prédictions uniques optimales. Cela permet au modèle de prédire des cadres de sélection exacts sans avoir besoin NMS filtrer les doublons pendant l'inférence.

De plus, YOLOv10 une conception holistique alliant efficacité et précision, optimisant les composants backbone et neck afin de réduire la redondance computationnelle. Il en résulte un modèle non seulement plus rapide, mais également plus efficace en termes de paramètres que ses prédécesseurs.

En savoir plus sur YOLOv10

EfficientDet : évolutif et robuste

Développé par Google fin 2019, EfficientDet a été conçu pour repousser les limites de l'efficacité en utilisant une philosophie différente : la mise à l'échelle composée. Il adapte systématiquement la résolution, la profondeur et la largeur du réseau afin d'obtenir de meilleures performances dans un large éventail de contraintes de ressources.

Détails d'EfficientDet :

L'avantage BiFPN

EfficientDet utilise une structure EfficientNet associée à un réseau pyramidal bidirectionnel pondéré (BiFPN). Contrairement aux FPN standard qui additionnent les caractéristiques sans distinction, le BiFPN attribue des pondérations aux caractéristiques d'entrée, ce qui permet au réseau d'apprendre l'importance des différentes échelles d'entrée. Bien que très précise, cette architecture implique des connexions inter-échelles complexes qui peuvent être coûteuses en termes de calcul sur du matériel qui n'est pas optimisé pour les modèles d'accès mémoire irréguliers.

Comparaison technique des performances

Le tableau suivant présente une comparaison directe des indicateurs. Notez la différence significative en termes de vitesse d'inférence, notamment grâce à la suppression de NMS YOLOv10 .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Analyse critique

  1. Latence contre précision : YOLOv10x atteint un mAP précision moyenne) supérieur de 54,4 % avec une TensorRT de seulement 12,2 ms. En revanche, EfficientDet-d7 atteint un mAP comparable de 53,7 %, mAP nécessite environ 128 ms, soit plus de 10 fois plus lent. Cela met en évidence le bond générationnel en matière d'optimisation en temps réel.
  2. Déploiement en périphérie : la conception NMS de YOLOv10 la donne en matière de déploiement de modèles. NMS souvent difficile à accélérer sur les NPU (unités de traitement neuronal) ou les puces embarquées. Sa suppression permet à l'ensemble du modèle de fonctionner comme un seul graphe, ce qui améliore considérablement la compatibilité avec des outils tels que OpenVINO et TensorRT.
  3. Efficacité de la formation : EfficientDet s'appuie sur TensorFlow et des stratégies de recherche AutoML complexes.YOLO Ultralytics , notamment YOLOv10 le plus récent YOLO26, sont basés sur PyTorch disposent de pipelines de formation optimisés qui gèrent automatiquement les hyperparamètres, ce qui permet une convergence plus rapide et réduit les besoins en mémoire.

L'avantage de l'écosystème Ultralytics

Le choix d'un modèle ne repose généralement pas uniquement sur l'architecture, mais également sur le flux de travail. Ultralytics offrent une expérience fluide aux développeurs.

  • Facilité d'utilisation : grâce auPython Ultralytics , vous pouvez charger, entraîner et déployer des modèles en trois lignes de code. Les implémentations EfficientDet nécessitent souvent une gestion complexe des dépendances et TensorFlow héritées TensorFlow .
  • Polyvalence : bien qu'EfficientDet soit principalement un détecteur d'objets, le Ultralytics prend en charge une suite complète de tâches, notamment la segmentation d'instances, l'estimation de poses et la détection OBB (Oriented Bounding Box).
  • Écosystème bien entretenu : Ultralytics des mises à jour fréquentes, garantissant la compatibilité avec les dernières bibliothèques matérielles et logicielles. L'intégration avec la Ultralytics facilite la gestion des ensembles de données et la formation dans le cloud.

Formation simplifiée

Ultralytics automatiquement les augmentations de données complexes et la planification des taux d'apprentissage. Vous n'avez pas besoin de régler manuellement les ancres ou les poids de perte pour obtenir des résultats de pointe.

Exemple de code : Formation avec Ultralytics

Le code suivant montre à quel point il est simple d'entraîner un modèle à l'aide de Ultralytics . Cela fonctionne de manière identique pour YOLOv10, YOLO11 et YOLO26, qui est recommandé.

from ultralytics import YOLO

# Load the latest recommended model (YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
# Ultralytics automatically handles device selection (CPU/GPU)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")

Pourquoi nous recommandons YOLO26

Alors que YOLOv10 le concept NMS, Ultralytics l'affine et le perfectionne. Lancé en janvier 2026, YOLO26 est actuellement à la pointe de la technologie en matière d'IA de pointe et de systèmes de production.

YOLO26 adopte la conception NMS de bout en bout mise au point par YOLOv10 l'améliore grâce à plusieurs innovations essentielles :

  • Optimiseur MuSGD : inspiré par l'entraînement LLM (plus précisément Kimi K2 de Moonshot AI), YOLO26 utilise un hybride de SGD de l'optimiseur Muon. Il en résulte une dynamique d'entraînement nettement plus stable et une convergence plus rapide que les générations précédentes.
  • Suppression du DFL : en supprimant le Distribution Focal Loss (DFL), YOLO26 simplifie la structure de la couche de sortie. Cela rend l'exportation vers des formats tels que CoreML ONNX propre, garantissant une meilleure compatibilité avec les appareils périphériques à faible consommation d'énergie.
  • Performances : YOLO26 offre CPU jusqu'à 43 % plus rapide que les versions précédentes, ce qui en fait le choix idéal pour les appareils sans GPU dédié, tels que les ordinateurs portables standard ou les configurations Raspberry Pi.
  • Gains spécifiques à certaines tâches : il comprend des fonctions de perte spécialisées telles que ProgLoss et STAL, qui apportent des améliorations notables dans la reconnaissance des petits objets, une faiblesse courante des détecteurs précédents.

En savoir plus sur YOLO26

Recommandations de cas d'utilisation

  • Applications en temps réel : véhicules autonomes, surveillance du trafic et analyse sportive, où une faible latence est essentielle.
  • Déploiement en périphérie : fonctionne sur les téléphones mobiles, les drones ou les appareils IoT où CPU et l'autonomie de la batterie sont limités.
  • Exigences multitâches : lorsque votre projet nécessite une segmentation, une estimation de pose ou la détection d'objets pivotés (OBB) en plus des boîtes englobantes standard.

Quand considérer EfficientDet

  • Recherche antérieure : si vous reproduisez des articles universitaires datant de la période 2019-2020 qui comparent spécifiquement les architectures EfficientDet.
  • Contraintes matérielles (spécifiques) : dans de rares cas, les accélérateurs matériels hérités sont strictement optimisés pour les structures BiFPN et ne peuvent pas s'adapter aux blocs modernes basés sur rep-vgg ou transformer.

Conclusion

EfficientDet a marqué un tournant dans l'efficacité de la mise à l'échelle, mais le domaine a continué d'évoluer. YOLOv10 a prouvé qu'une détection NMS était possible, et YOLO26 l'a perfectionnée pour la production. Pour les développeurs à la recherche du meilleur équilibre entre vitesse, précision et facilité d'utilisation, Ultralytics est le choix incontournable. Son architecture rationalisée, combinée au puissant écosystème Ultralytics , vous permet de passer du concept au déploiement plus rapidement que jamais.

Pour en savoir plus sur les architectures de modèles, consultez nos comparaisons entre YOLOv8 YOLOv10 ou explorez la Ultralytics pour commencer votre formation dès aujourd'hui.


Commentaires