YOLOv6.0 vs EfficientDet : comparaison technique complète
Le choix de l'architecture optimale pour les projets de vision par ordinateur nécessite une compréhension approfondie des compromis entre vitesse, précision et faisabilité du déploiement. Cette page de comparaison fournit une analyse approfondie de deux modèles distincts de détection d'objets : YOLOv6. YOLOv6 et EfficientDet. Bien que ces deux modèles aient apporté une contribution significative dans ce domaine, les déploiements de pointe modernes et le prototypage rapide bénéficient souvent de cadres plus unifiés, tels que la Ultralytics .
Vous trouverez ci-dessous un graphique interactif illustrant les différences de performances entre ces modèles afin de vous aider à comprendre leurs profils respectifs en matière de latence et de précision.
YOLOv6.0 : débit de niveau industriel
YOLOv6.YOLOv6 a été explicitement conçu par Meituan pour servir de cadre de détection d'objets haute performance en une seule étape, adapté aux applications industrielles. Il se concentre principalement sur l'optimisation du débit sur GPU , ce qui en fait un candidat idéal pour les lignes de fabrication à grande vitesse et l'analyse vidéo hors ligne.
- Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
- Organisation : Meituan
- Date : 13 janvier 2023
- Arxiv : 2301.05586
- GitHub : YOLOv6
Points forts architecturaux
L'architecture YOLOv6. YOLOv6 s'appuie sur un module de concaténation bidirectionnelle (BiC) pour améliorer la fusion des caractéristiques à différentes échelles. Afin de garantir des vitesses d'inférence élevées, elle exploite une structure EfficientRep, hautement optimisée pour GPU . De plus, elle utilise une stratégie d'apprentissage assisté par ancrage (AAT), qui combine les avantages des détecteurs basés sur l'ancrage et sans ancrage pendant la phase d'apprentissage, tout en conservant un pipeline d'inférence sans ancrage pour réduire la latence.
Points forts et faiblesses
YOLOv6 excelle dans les environnements où GPU dédié est disponible, offrant une inférence en temps réel incroyablement rapide grâce à TensorRT. Cependant, sa forte dépendance à des optimisations matérielles spécifiques peut entraîner des performances sous-optimales sur les appareils d'IA de pointe CPU. De plus, bien qu'il prenne en charge une certaine quantification, l'écosystème manque de la simplicité globale que l'on trouve dans Ultralytics modernes.
EfficientDet : architecture AutoML évolutive
Développé par Google , EfficientDet adopte une approche fondamentalement différente. Au lieu de créer le réseau à la main, les auteurs ont utilisé l'apprentissage automatique automatisé (AutoML) pour concevoir une architecture évolutive qui équilibre les paramètres, les FLOP et la précision.
- Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
- Organisation : Google
- Date : 20 novembre 2019
- Arxiv : 1911.09070
- GitHub : google
Points forts architecturaux
EfficientDet a introduit le réseau pyramidal bidirectionnel (BiFPN), qui permet une fusion facile et rapide des caractéristiques à plusieurs échelles. Combinés à une méthode de mise à l'échelle composite qui adapte uniformément la résolution, la profondeur et la largeur pour tous les réseaux dorsaux, les réseaux de caractéristiques et les réseaux de prédiction de boîtes/classes, les modèles EfficientDet vont du très compact d0 au très volumineux d7.
Points forts et faiblesses
EfficientDet est très efficace en termes de paramètres. Il atteint une précision moyenne (mAP) élevée avec relativement peu de paramètres par rapport aux anciens détecteurs d'objets. Cependant, son architecture est profondément ancrée dans TensorFlow hérités. Il en résulte une gestion complexe des dépendances, des cycles d'entraînement plus lents et des besoins en mémoire plus importants pendant l'entraînement par rapport PyTorch optimisées. De plus, sa vitesse d'inférence sur les GPU modernes est nettement plus lente que YOLO modernes.
En savoir plus sur EfficientDet
Comparaison détaillée des performances
Le tableau ci-dessous compare les spécifications techniques de YOLOv6. YOLOv6 et EfficientDet à l'aide de différents indicateurs. Notez que YOLOv6. YOLOv6 domine en termes de GPU , tandis qu'EfficientDet atteint mAP plus élevé mAP prix d'une latence importante.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Latence vs débit
Lorsque vous comparez des modèles, n'oubliez pas que les FLOP et le nombre de paramètres ne correspondent pas toujours parfaitement à la latence réelle. YOLOv6. YOLOv6 est optimisé pour TensorRT, atteignant des vitesses de l'ordre de la milliseconde malgré un nombre de FLOP supérieur à celui des modèles EfficientDet de niveau inférieur.
L'avantage de l'écosystème Ultralytics
Alors que YOLOv6. YOLOv6 et EfficientDet répondent à des besoins spécifiques, les projets modernes de vision par ordinateur exigent polyvalence, facilité d'utilisation et un écosystème bien entretenu. C'est là qu'intervient Ultralytics YOLO se distinguent véritablement.
Facilité d'utilisation et efficacité de la formation
Contrairement à EfficientDet, qui nécessite de naviguer dans TensorFlow complexes, Ultralytics sont construits sur une PyTorch intuitive. La Ultralytics offre une API rationalisée qui simplifie l'ensemble du cycle de vie de l'apprentissage automatique. La formation d'un Ultralytics nécessite beaucoup moins CUDA , ce qui accélère l'expérimentation et réduit les coûts de calcul.
Polyvalence inégalée
YOLOv6.YOLOv6 et EfficientDet sont principalement liés à la détection d'objets. En revanche, Ultralytics modernes sont intrinsèquement multimodales. Une interface unique vous permet de former des modèles pour les tâches de segmentation d'instances, d'estimation de pose, de classification d'images et de boîtes englobantes orientées (OBB).
Présentation Ultralytics
Pour les développeurs à la recherche d'un équilibre optimal en termes de performances, Ultralytics représente un changement de paradigme. Lancé en janvier 2026, il introduit plusieurs innovations révolutionnaires qui surpassent à la fois YOLOv6 EfficientDet :
- Conception NMS de bout en bout : YOLO26 élimine nativement le besoin d'un post-traitement par suppression non maximale (NMS), ce qui réduit considérablement la variance de latence et simplifie la logique de déploiement sur les appareils périphériques.
- Optimiseur MuSGD : inspiré de la formation LLM, cet optimiseur hybride garantit une formation stable et une convergence incroyablement rapide.
- CPU jusqu'à 43 % plus rapide : grâce à la suppression de la perte focale de distribution (DFL), YOLO26 est nettement plus efficace sur les CPU et les appareils IoT à faible consommation d'énergie que les modèles précédents.
- ProgLoss + STAL : ces fonctions de perte avancées apportent des améliorations considérables dans la reconnaissance des petits objets, rendant YOLO26 idéal pour les applications de drones et d'imagerie aérienne.
Cas d'utilisation et recommandations
Le choix entre YOLOv6 EfficientDet dépend des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.
Quand choisir YOLOv6
YOLOv6 un excellent choix pour :
- Déploiement tenant compte du matériel industriel : scénarios dans lesquels la conception tenant compte du matériel et la reparamétrisation efficace du modèle offrent des performances optimisées sur un matériel cible spécifique.
- Détection rapide en une seule étape : applications donnant la priorité à la vitesse d'inférence brute sur GPU le traitement vidéo en temps réel dans des environnements contrôlés.
- Intégration de l'écosystème Meituan : équipes travaillant déjà au sein de la pile technologique et de l'infrastructure de déploiement de Meituan.
Quand choisir EfficientDet
EfficientDet est recommandé pour :
- Google et TPU : systèmes profondément intégrés aux API Google Vision ou à TPU , où EfficientDet dispose d'une optimisation native.
- Recherche sur la mise à l'échelle des composés : analyse comparative académique axée sur l'étude des effets d'une mise à l'échelle équilibrée de la profondeur, de la largeur et de la résolution du réseau.
- Déploiement mobile via TFLite: projets qui nécessitent spécifiquement l'exportation TensorFlow pour Android les appareils Linux embarqués.
Quand choisir Ultralytics YOLO26)
Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :
- DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
- EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
- Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.
Exemple de mise en œuvre : formation YOLO26
Le code suivant illustre la simplicité de Ultralytics . Former un modèle de pointe est aussi simple que de charger les poids et de pointer vers vos données.
from ultralytics import YOLO
# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")
Autres modèles à considérer
Si vous explorez le paysage plus large des modèles de vision par ordinateur, envisagez ces alternatives :
- YOLO11: le prédécesseur très populaire de YOLO26, offrant de solides capacités multitâches et un large soutien communautaire.
- YOLOv10: la première YOLO à introduire l'entraînement NMS, ouvrant la voie à la détection moderne de bout en bout.
- RT-DETR: pour les scénarios où les architectures basées sur des transformateurs et les mécanismes d'attention sont préférés aux CNN traditionnels.
Conclusion
Si YOLOv6.YOLOv6 offre GPU excellent GPU industriel et EfficientDet démontre le potentiel d'AutoML dans la création de réseaux évolutifs et efficaces en termes de paramètres, ces deux modèles présentent toutefois des limites en termes de facilité de déploiement et de polyvalence multitâche moderne.
Pour la grande majorité des applications concrètes, du déploiement mobile de pointe à l'analyse basée sur le cloud, Ultralytics offre un équilibre de performances inégalé. En adoptant YOLO26, les développeurs ont accès à une inférence de pointe NMS, à des fonctions de perte avancées pour les petits objets et à un pipeline de formation unifié et bien documenté qui accélère considérablement le passage du prototype à la production.