Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 vs. EfficientDet : une comparaison technique complète#

Choisir l'architecture optimale pour tes projets de computer vision nécessite une compréhension approfondie des compromis entre vitesse, précision et faisabilité du déploiement. Cette page de comparaison fournit une analyse approfondie de deux modèles de détection d'objets distincts : YOLOv6-3.0 et EfficientDet. Bien que les deux modèles aient contribué de manière significative au domaine, les déploiements modernes en périphérie et le prototypage rapide tirent souvent profit de frameworks plus unifiés comme la Ultralytics Platform.

Tu trouveras ci-dessous un graphique interactif visualisant les différences de performance entre ces modèles pour t'aider à comprendre leurs profils respectifs de latence et de précision.

Link to this sectionYOLOv6-3.0 : Débit de qualité industrielle#

YOLOv6-3.0 a été explicitement conçu par Meituan pour servir de framework de détection d'objets à une seule étape et haute performance, adapté aux applications industrielles. Il se concentre fortement sur la maximisation du débit sur le matériel GPU, ce qui en fait un candidat solide pour les lignes de fabrication à grande vitesse et l'analyse vidéo hors ligne.

  • Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
  • Organisation : Meituan
  • Date : 13-01-2023
  • Arxiv : 2301.05586
  • GitHub : meituan/YOLOv6

Link to this sectionPoints forts architecturaux#

L'architecture YOLOv6-3.0 repose sur un module de concaténation bidirectionnelle (BiC) pour améliorer la fusion des caractéristiques à différentes échelles. Pour garantir des vitesses d'inférence élevées, il exploite un backbone EfficientRep, hautement optimisé pour l'exécution sur GPU. De plus, il emploie une stratégie d'entraînement assistée par ancres (AAT), fusionnant les avantages des détecteurs basés sur des ancres et des anchor-free detectors pendant la phase d'entraînement, tout en conservant un pipeline d'inférence sans ancres pour réduire la latence.

Link to this sectionPoints forts et faiblesses#

YOLOv6-3.0 brille dans les environnements où du matériel GPU dédié est disponible, offrant une real-time inference incroyablement rapide en utilisant TensorRT. Cependant, sa forte dépendance à des optimisations matérielles spécifiques peut conduire à des performances sous-optimales sur des edge AI devices fonctionnant uniquement sur CPU. De plus, bien qu'il prenne en charge une certaine quantification, l'écosystème manque de la simplicité globale que l'on trouve dans les frameworks Ultralytics modernes.

En savoir plus sur YOLOv6

Link to this sectionEfficientDet : Architecture AutoML évolutive#

Développé par Google Research, EfficientDet adopte une approche fondamentalement différente. Au lieu de concevoir le réseau manuellement, les auteurs ont utilisé Automated Machine Learning (AutoML) pour concevoir une architecture évolutive qui équilibre les paramètres, les FLOPs et la précision.

Link to this sectionPoints forts architecturaux#

EfficientDet a introduit le réseau pyramidal de caractéristiques bidirectionnel (BiFPN), qui permet une fusion multi-échelle des caractéristiques facile et rapide. Combiné à une méthode de mise à l'échelle composée qui adapte uniformément la résolution, la profondeur et la largeur pour tous les backbones, réseaux de caractéristiques et réseaux de prédiction de boîtes/classes, les modèles EfficientDet vont du d0 hautement compact au d7 massif.

Link to this sectionPoints forts et faiblesses#

EfficientDet est très efficace en termes de paramètres. Il atteint une mean Average Precision (mAP) élevée avec relativement peu de paramètres par rapport aux anciens détecteurs d'objets. Cependant, l'architecture est profondément ancrée dans les écosystèmes TensorFlow hérités. Cela entraîne une gestion complexe des dépendances, des cycles d'entraînement plus lents et des memory requirements plus élevés pendant l'entraînement par rapport aux implémentations PyTorch optimisées. De plus, sa vitesse d'inférence sur les GPU modernes est significativement plus lente que celle des architectures YOLO modernes.

En savoir plus sur EfficientDet

Link to this sectionComparaison détaillée des performances#

Le tableau ci-dessous contraste les spécifications techniques de YOLOv6-3.0 et EfficientDet selon diverses métriques. Note comment YOLOv6-3.0 domine en vitesse GPU, tandis qu'EfficientDet monte en gamme jusqu'à une mAP plus élevée au prix d'une latence significative.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037,5-1,174.711.4
YOLOv6-3.0s64045,0-2.6618,545,3
YOLOv6-3.0m64050,0-5,2834,985,8
YOLOv6-3.0l64052,8-8,9559,6150,7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520,755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
Latence vs. Débit

Lorsque tu compares des modèles, souviens-toi que les FLOPs et le nombre de paramètres ne sont pas toujours parfaitement corrélés à la latence réelle. YOLOv6-3.0 est optimisé pour TensorRT, atteignant des vitesses de l'ordre de la milliseconde malgré un nombre de FLOPs plus élevé que les modèles EfficientDet d'entrée de gamme.

Link to this sectionL'avantage de l'écosystème Ultralytics#

Bien que YOLOv6-3.0 et EfficientDet occupent des niches spécifiques, les projets de vision par ordinateur modernes exigent polyvalence, facilité d'utilisation et un écosystème bien entretenu. C'est là que les modèles Ultralytics YOLO excellent vraiment.

Link to this sectionFacilité d'utilisation et efficacité de l'entraînement#

Contrairement à EfficientDet, qui nécessite de naviguer dans des configurations TensorFlow complexes, les modèles Ultralytics sont construits sur une base PyTorch intuitive. La Ultralytics Platform offre une API rationalisée qui simplifie l'ensemble du cycle de vie du machine learning. L'entraînement d'un modèle Ultralytics nécessite beaucoup moins de mémoire CUDA, accélérant l'expérimentation et réduisant les coûts de calcul.

Link to this sectionPolyvalence inégalée#

YOLOv6-3.0 et EfficientDet sont principalement limités à la object detection. En revanche, les architectures Ultralytics modernes sont intrinsèquement multimodales. Une interface unique te permet d'entraîner des modèles pour des tâches de Instance Segmentation, de Pose Estimation, de Image Classification et d'Oriented Bounding Box (OBB).

Link to this sectionPrésentation de Ultralytics YOLO26#

Pour les développeurs recherchant l'équilibre de performance ultime, Ultralytics YOLO26 représente un changement de paradigme. Sorti en janvier 2026, il introduit plusieurs innovations révolutionnaires qui surpassent à la fois YOLOv6 et EfficientDet :

  • Conception de bout en bout sans NMS : YOLO26 élimine nativement le besoin de post-traitement par Non-Maximum Suppression (NMS), réduisant considérablement la variance de latence et simplifiant la logique de déploiement sur les appareils en périphérie.
  • Optimiseur MuSGD : Inspiré par l'entraînement des LLM, cet optimiseur hybride garantit un entraînement stable et une convergence incroyablement rapide.
  • Inférence CPU jusqu'à 43 % plus rapide : Avec la suppression de la Distribution Focal Loss (DFL), YOLO26 est bien plus efficace sur les CPU et les appareils IoT à faible consommation par rapport aux modèles hérités.
  • ProgLoss + STAL : Ces fonctions de perte avancées apportent des améliorations massives dans la reconnaissance des petits objets, rendant YOLO26 idéal pour les applications par drone et en imagerie aérienne.

En savoir plus sur YOLO26

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLOv6 et EfficientDet dépend de tes exigences de projet spécifiques, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOv6#

YOLOv6 est un choix solide pour :

  • Déploiement industriel conscient du matériel : Les scénarios où la conception du modèle axée sur le matériel et la reparamétrisation efficace offrent des performances optimisées sur un matériel cible spécifique.
  • Détection rapide en une étape : Les applications priorisant la vitesse d'inférence brute sur GPU pour le traitement vidéo en temps réel dans des environnements contrôlés.
  • Intégration à l'écosystème Meituan : Les équipes travaillant déjà au sein de la pile technologique et de l'infrastructure de déploiement de Meituan.

Link to this sectionQuand choisir EfficientDet#

EfficientDet est recommandé pour :

  • Pipelines Google Cloud et TPU : Systèmes profondément intégrés aux API Google Cloud Vision ou à l'infrastructure TPU, où EfficientDet bénéficie d'une optimisation native.
  • Recherche sur le Compound Scaling : Analyse comparative académique axée sur l'étude des effets de l'équilibre entre la profondeur, la largeur et la résolution du réseau.
  • Déploiement mobile via TFLite : Les projets qui nécessitent spécifiquement une exportation TensorFlow Lite pour Android ou des appareils Linux embarqués.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionExemple d'implémentation : Entraîner YOLO26#

Le code suivant démontre la simplicité de l'écosystème Ultralytics. Entraîner un modèle de pointe est aussi simple que de charger les poids et de pointer vers tes données.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this sectionAutres modèles à considérer#

Si tu explores le paysage plus large des modèles de vision par ordinateur, considère ces alternatives :

  • YOLO11 : Le prédécesseur très réussi de YOLO26, offrant des capacités multi-tâches robustes et un support communautaire étendu.
  • YOLOv10 : La première architecture YOLO à introduire l'entraînement sans NMS, ouvrant la voie à la détection moderne de bout en bout.
  • RT-DETR : Pour les scénarios où les architectures basées sur les Transformer et les mécanismes d'attention sont préférés aux CNN traditionnels.

Link to this sectionConclusion#

Alors que YOLOv6-3.0 offre un excellent débit GPU industriel et que EfficientDet démontre le potentiel de l'AutoML dans la création de réseaux évolutifs et efficaces en paramètres, les deux modèles présentent des limites en termes de facilité de déploiement et de polyvalence multi-tâches moderne.

Pour la vaste majorité des applications réelles — du déploiement sur mobile en périphérie à l'analyse basée sur le cloud — l'écosystème Ultralytics offre un performance balance inégalé. En adoptant YOLO26, les développeurs accèdent à une inférence de pointe sans NMS, à des fonctions de perte avancées pour les petits objets et à un pipeline d'entraînement unifié et bien documenté qui accélère considérablement le passage du prototype à la production.

Contributeurs

Commentaires