Link to this sectionDAMO-YOLO vs EfficientDet#

L'évolution de la vision par ordinateur a produit une gamme d'architectures puissantes adaptées aux diverses exigences du monde réel. Tandis que certains frameworks privilégient une évolutivité massive, d'autres se concentrent fortement sur la vitesse d'inférence en temps réel. Dans cette comparaison technique, nous explorons DAMO-YOLO et EfficientDet, deux modèles très influents qui présentent des approches distinctes pour résoudre le problème de la détection d'objets. Nous disséquerons leurs architectures, comparerons leurs performances de référence et explorerons enfin pourquoi le tout nouveau Ultralytics YOLO26 représente le choix optimal pour les déploiements en production modernes.

Link to this sectionAperçu architectural#

Les deux modèles ont été conçus pour aborder le compromis efficacité-précision, mais ils reposent sur des mécanismes fondamentalement différents pour atteindre leurs objectifs.

Link to this sectionDAMO-YOLO : la vitesse grâce à la recherche d'architecture neuronale#

Développé pour repousser les limites de la détection en temps réel, DAMO-YOLO exploite des techniques de recherche automatisées pour construire des réseaux très efficaces adaptés aux environnements à faible latence.

Détails de DAMO-YOLO :
Auteurs : Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang et Xiuyu Sun
Organisation : Alibaba Group
Date : 23/11/2022
Arxiv : https://arxiv.org/abs/2211.15444v2
GitHub : https://github.com/tinyvision/DAMO-YOLO

DAMO-YOLO est construit autour d'une dorsale (backbone) de recherche d'architecture neuronale (NAS) qui optimise à la fois la vitesse et la précision. Il introduit le RepGFPN (Reparameterized Generalized Feature Pyramid Network), qui améliore la fusion des caractéristiques tout en maintenant des vitesses d'inférence élevées. De plus, sa conception ZeroHead minimise la surcharge de calcul généralement associée aux têtes de détection. Le modèle bénéficie également de l'AlignedOTA (Aligned Optimal Transport Assignment) et de l'amélioration par distillation, garantissant que même les plus petites variantes apprennent des représentations riches à partir de modèles plus grands.

En savoir plus sur DAMO-YOLO

Link to this sectionEfficientDet : évolutivité par mise à l'échelle composée#

Contrairement à l'approche privilégiant la vitesse, EfficientDet se concentre sur une évolutivité systématique à travers divers budgets de calcul.

Détails d'EfficientDet :
Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
Organisation : Google Brain
Date : 20/11/2019
Arxiv : https://arxiv.org/abs/1911.09070
GitHub : https://github.com/google/automl/tree/master/efficientdet

EfficientDet introduit le BiFPN (Bidirectional Feature Pyramid Network), qui permet une fusion multi-échelle des caractéristiques facile et rapide. Contrairement aux méthodes traditionnelles qui font évoluer les architectures en ajoutant arbitrairement des couches ou des canaux, EfficientDet utilise une méthode de mise à l'échelle composée qui adapte uniformément la résolution, la profondeur et la largeur de la dorsale, du réseau de caractéristiques et des réseaux de prédiction de boîtes/classes simultanément. Cela lui permet d'atteindre une précision de pointe sur du matériel haut de gamme tout en offrant des variantes plus petites pour les environnements contraints.

En savoir plus sur EfficientDet

Link to this sectionComparaison des performances et des mesures#

Lorsque l'on compare ces modèles côte à côte, le compromis entre précision pure et vitesse d'inférence devient clair. Le tableau ci-dessous décrit les métriques de performance clés, soulignant comment les capacités d'inférence de DAMO-YOLO se comparent à la famille de modèles EfficientDet.

Modèle	taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97,3

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20,7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

Comme on le voit ci-dessus, EfficientDet-d7 atteint la précision globale la plus élevée, ce qui le rend adapté aux applications cloud rigoureuses. Inversement, la série DAMO-YOLO offre une précision hautement compétitive avec une latence nettement inférieure sur le matériel GPU, ce qui en fait un candidat plus solide pour les déploiements en périphérie (edge) en temps réel.

Link to this sectionCas d'utilisation et recommandations#

Le choix entre DAMO-YOLO et EfficientDet dépend des exigences spécifiques de ton projet, des contraintes de déploiement et des préférences concernant l'écosystème.

Link to this sectionQuand choisir DAMO-YOLO#

DAMO-YOLO est un choix solide pour :

Analytique vidéo à haut débit : Traitement de flux vidéo FPS élevés sur une infrastructure GPU NVIDIA fixe où le débit par lot est la mesure principale.
Lignes de fabrication industrielle : Scénarios avec des contraintes strictes de latence GPU sur du matériel dédié, comme l'inspection qualité en temps réel sur les lignes d'assemblage.
Recherche sur la recherche d'architecture neuronale : Étude des effets de la recherche d'architecture automatisée (MAE-NAS) et des backbones reparamétrés efficaces sur les performances de détection.

Link to this sectionQuand choisir EfficientDet#

EfficientDet est recommandé pour :

Pipelines Google Cloud et TPU : Systèmes profondément intégrés aux API Google Cloud Vision ou à l'infrastructure TPU, où EfficientDet bénéficie d'une optimisation native.
Recherche sur le Compound Scaling : Analyse comparative académique axée sur l'étude des effets de l'équilibre entre la profondeur, la largeur et la résolution du réseau.
Déploiement mobile via TFLite : Les projets qui nécessitent spécifiquement une exportation TensorFlow Lite pour Android ou des appareils Linux embarqués.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionL'alternative moderne : Ultralytics YOLO26#

Bien que DAMO-YOLO et EfficientDet représentent des jalons académiques importants, le déploiement dans le monde réel nécessite souvent une approche plus équilibrée, riche en fonctionnalités et adaptée aux développeurs. C'est là qu'Ultralytics YOLO26 établit une nouvelle norme industrielle.

Sorti en janvier 2026, YOLO26 s'appuie sur l'héritage de ses prédécesseurs, dont Ultralytics YOLO11 et YOLOv8, offrant un changement de paradigme dans notre approche de la détection d'objets.

Simplicité de bout en bout

YOLO26 propose une conception native de bout en bout sans NMS. En éliminant la suppression non maximale (NMS) lors du post-traitement—un goulot d'étranglement qui a longtemps affecté les détecteurs d'objets—, YOLO26 offre un pipeline de déploiement plus simple et beaucoup plus rapide, en particulier sur le matériel en périphérie.

Link to this sectionPerformance et polyvalence inégalées#

YOLO26 n'améliore pas seulement la vitesse ; il redéfinit la stabilité de l'entraînement et la précision. Il introduit l'optimiseur MuSGD, un hybride de SGD et Muon inspiré des innovations en entraînement LLM, conduisant à des taux de convergence nettement plus rapides et à une efficacité d'entraînement supérieure. Contrairement aux alternatives lourdes basées sur les transformeurs comme RT-DETR, YOLO26 maintient des exigences de mémoire incroyablement faibles, garantissant qu'il peut être entraîné sur du matériel grand public.

De plus, YOLO26 intègre ProgLoss + STAL, améliorant considérablement la reconnaissance des petits objets, ce qui est vital pour des cas d'utilisation comme l'imagerie aérienne par drone et la robotique. Pour optimiser les appareils à faible consommation, YOLO26 a supprimé la Distribution Focal Loss (DFL), ce qui se traduit par une inférence CPU jusqu'à 43 % plus rapide par rapport aux générations précédentes.

Link to this sectionÉcosystème et facilité d'utilisation#

L'un des plus grands obstacles avec des modèles comme EfficientDet est le processus d'intégration complexe. En revanche, la plateforme Ultralytics offre un écosystème de bout en bout bien maintenu. Grâce à une API unifiée, les utilisateurs peuvent facilement pivoter entre la détection, la segmentation d'instances, l'estimation de pose, la classification d'images et les boîtes englobantes orientées (OBB).

Voici à quel point il est simple d'entraîner et d'exécuter une inférence avec YOLO26 en utilisant le package Python Ultralytics :

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run ultra-fast NMS-free inference
predictions = model.predict("image.jpg")

En savoir plus sur YOLO26

Link to this sectionConclusion#

Bien qu'explorer DAMO-YOLO vs EfficientDet fournisse d'excellents aperçus sur les compromis entre la recherche d'architecture neuronale et la mise à l'échelle composée, les développeurs modernes ont besoin d'outils qui comblent le fossé entre la recherche académique et la réalité de la production.

Pour les développeurs privilégiant la facilité d'utilisation, une communauté open source active et un équilibre sans compromis entre vitesse et précision, Ultralytics YOLO26 est le choix définitif. Son architecture sans NMS, sa faible surcharge d'entraînement et son intégration transparente avec l'écosystème complet Ultralytics en font le cadre ultime pour ton prochain projet de vision par ordinateur.

Contributeurs

GLglenn-jocher¹⁵

Créé 27 janv. 2025Mis à jour il y a 4 semaines