Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet vs YOLOv9#

Le paysage de la vision par ordinateur a été façonné par des percées continues dans la conception de réseaux de neurones. Trouver le juste équilibre entre efficacité computationnelle et précision de détection est essentiel lors de la sélection d'un modèle. L'EfficientDet de Google a établi une base solide en 2019 en introduisant des architectures évolutives, tandis que YOLOv9, sorti en 2024, a repoussé les limites de la détection d'objets grâce aux Programmable Gradient Information (PGI).

Ce guide propose une comparaison technique complète entre ces deux modèles et présente le framework moderne Ultralytics YOLO26, qui offre une solution robuste et de bout en bout, optimisée pour les environnements de production.

Link to this sectionArchitectures et innovations des modèles#

Comprendre les mécanismes sous-jacents d'EfficientDet et de YOLOv9 est essentiel pour déterminer leurs cas d'utilisation optimaux.

Link to this sectionEfficientDet : Mise à l'échelle composée et BiFPN#

Développé par Google Research, EfficientDet se concentre sur une mise à l'échelle systématique et une fusion efficace des caractéristiques. Il utilise EfficientNet comme backbone et introduit une nouvelle architecture de réseau de caractéristiques.

  • Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
  • Organisation : Google
  • Date : 20 novembre 2019
  • Liens : Arxiv, GitHub

Fonctionnalités architecturales clés : EfficientDet repose fortement sur un Bi-directional Feature Pyramid Network (BiFPN), qui permet une fusion multi-échelle des caractéristiques simple et rapide. Parallèlement, il utilise une méthode de mise à l'échelle composée qui adapte uniformément la résolution, la profondeur et la largeur du réseau. Bien que très précis pour son époque, EfficientDet reste étroitement lié à d'anciens environnements TensorFlow, ce qui rend les pipelines de déploiement modernes complexes.

En savoir plus sur EfficientDet

Link to this sectionYOLOv9 : Résoudre le goulot d'étranglement de l'information#

Développé par des chercheurs de l'Academia Sinica, YOLOv9 s'attaque à la dégradation de l'information lors du passage des données à travers des réseaux de neurones profonds.

  • Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica
  • Date : 21 février 2024
  • Liens : Arxiv, GitHub, Docs

Fonctionnalités architecturales clés : YOLOv9 introduit la Programmable Gradient Information (PGI) pour fournir une supervision auxiliaire, garantissant que les données cruciales sont conservées pour mettre à jour les poids du réseau de manière fiable. Il intègre également le Generalized Efficient Layer Aggregation Network (GELAN) pour maximiser l'efficacité des paramètres. Malgré ces avancées, YOLOv9 nécessite toujours une Non-Maximum Suppression (NMS) lors du post-traitement, ce qui ajoute de la latence.

En savoir plus sur YOLOv9

Link to this sectionComparaison des performances#

Lors de l'évaluation de ces modèles, l'analyse de données empiriques aide à déterminer quelle architecture offre le meilleur compromis pour tes exigences matérielles spécifiques.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520,755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionAnalyse critique#

YOLOv9 représente un saut générationnel en termes de vitesse. Par exemple, YOLOv9e atteint une mAP de 55,6 % avec une latence TensorRT de 16,77 ms. À l'inverse, EfficientDet-d7 offre une mAP plus faible de 53,7 %, mais souffre d'une latence massive (128,07 ms), ce qui le rend extrêmement difficile à déployer pour des flux vidéo en temps réel.

Exporter des modèles pour la production

Exporter ton architecture vers des formats optimisés comme TensorRT ou OpenVINO réduit considérablement les temps d'inférence par rapport aux exécutions PyTorch brutes.

Link to this sectionCas d'utilisation et recommandations#

Choisir entre EfficientDet et YOLOv9 dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir EfficientDet#

EfficientDet est un choix solide pour :

  • Pipelines Google Cloud et TPU : Systèmes profondément intégrés aux API Google Cloud Vision ou à l'infrastructure TPU, où EfficientDet bénéficie d'une optimisation native.
  • Recherche sur le Compound Scaling : Analyse comparative académique axée sur l'étude des effets de l'équilibre entre la profondeur, la largeur et la résolution du réseau.
  • Déploiement mobile via TFLite : Les projets qui nécessitent spécifiquement une exportation TensorFlow Lite pour Android ou des appareils Linux embarqués.

Link to this sectionQuand choisir YOLOv9#

YOLOv9 est recommandé pour :

  • Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
  • Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionL'avantage Ultralytics : choisir YOLO26#

Bien que YOLOv9 et EfficientDet aient ouvert la voie, les développeurs à la recherche d'un framework moderne et prêt pour la production devraient envisager les modèles Ultralytics YOLO, et plus particulièrement le nouveau YOLO26.

La plateforme Ultralytics offre une facilité d'utilisation inégalée, combinant des scripts d'entraînement locaux puissants avec une interface cloud. YOLO26 représente une refonte majeure dans la conception des modèles, rendant les anciennes architectures obsolètes pour de nombreuses applications commerciales.

Link to this sectionPoints forts techniques de YOLO26#

  • Conception de bout en bout sans NMS : YOLO26 élimine totalement les goulots d'étranglement liés au post-traitement. En supprimant la Non-Maximum Suppression, les graphes de déploiement sont unifiés et intrinsèquement plus rapides sur les puces d'IA en périphérie.
  • Jusqu'à 43 % d'inférence CPU plus rapide : Optimisé intensivement pour les appareils embarqués, le rendant nettement plus rapide que YOLOv9 et EfficientDet lorsque les GPU ne sont pas disponibles.
  • Optimiseur MuSGD : Intégrant des innovations de LLM dans l'IA visuelle, cet optimiseur hybride stabilise les entraînements, permettant aux modèles de converger plus rapidement avec moins de ressources.
  • Faibles besoins en mémoire : Contrairement aux architectures lourdes basées sur des Transformer ou aux CNN non optimisés, YOLO26 minimise la consommation de mémoire CUDA lors de l'entraînement, te permettant d'utiliser des tailles de batch plus importantes sur du matériel grand public.
  • ProgLoss + STAL : Une conception de fonction de perte supérieure améliore considérablement la précision pour la détection de petits objets, faisant de YOLO26 la solution idéale pour l'imagerie aérienne et les réseaux IoT.
  • Suppression du DFL : Une conception structurelle simplifiée permet une conversion sans friction vers des formats de déploiement mobile.

En savoir plus sur YOLO26

D'autres options robustes au sein de l'écosystème Ultralytics incluent YOLO11 et YOLOv8, qui offrent également une polyvalence multi-tâches comme la segmentation d'instances et l'estimation de pose.

Link to this sectionEntraînement simplifié avec le SDK Python#

Les modèles Ultralytics privilégient l'expérience développeur. L'entraînement d'un modèle de pointe est condensé en quelques lignes de Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Link to this sectionApplications concrètes#

Le choix entre ces architectures dépend fortement de ta cible de déploiement.

  • Déploiements Cloud hérités : EfficientDet était populaire pour le traitement par lots hors ligne et basé sur le cloud, où une grande précision était nécessaire et où les contraintes strictes de temps réel n'existaient pas.
  • Recherche académique : YOLOv9 reste un choix intéressant pour les chercheurs qui repoussent les limites théoriques des CNN et analysent les flux de gradients à travers les couches de réseau.
  • Edge Computing et IoT : YOLO26 domine les applications réelles. Son pipeline sans NMS et ses capacités d'Oriented Bounding Box (OBB) en font l'option supérieure pour l'analyse du trafic urbain intelligent, la surveillance des stocks en magasin et l'inspection par drone, offrant un équilibre imbattable entre haute précision et vitesses d'inférence rapides.
Contributeurs

Commentaires