Passer au contenu

EfficientDet vs YOLOv9: architecture, performances et déploiement en périphérie

Le paysage de la vision par ordinateur a été façonné par des avancées continues dans la conception des réseaux neuronaux. Il est essentiel de trouver le bon équilibre entre efficacité computationnelle et précision de détection lors du choix d'un modèle. EfficientDet Google a établi une base solide en 2019 en introduisant des architectures évolutives, tandis que YOLOv9, lancé en 2024, a repoussé les limites de la détection d'objets grâce à la technologie PGI (Programmable Gradient Information).

Ce guide fournit une comparaison technique complète entre ces deux modèles et présente le cadre moderne Ultralytics , qui offre une solution robuste de bout en bout optimisée pour les environnements de production.

Architectures modèles et innovations

YOLOv9 essentiel de comprendre les mécanismes sous-jacents d'EfficientDet et de YOLOv9 pour déterminer leurs cas d'utilisation optimaux.

EfficientDet : Compound Scaling et BiFPN

Développé par Google , EfficientDet se concentre sur la mise à l'échelle systématique et la fusion efficace des fonctionnalités. Il utilise EfficientNet comme base et introduit une nouvelle architecture de réseau de fonctionnalités.

  • Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
  • Organisation :Google
  • Date : 20 novembre 2019
  • Liens :Arxiv, GitHub

Principales caractéristiques architecturales : EfficientDet s'appuie fortement sur un réseau pyramidal bidirectionnel (BiFPN), qui permet une fusion facile et rapide des caractéristiques à plusieurs échelles. Parallèlement, il utilise une méthode de mise à l'échelle composite qui adapte uniformément la résolution, la profondeur et la largeur du réseau. Bien que très précis pour son époque, EfficientDet est fortement lié à l'ancien TensorFlow , ce qui rend les pipelines de déploiement modernes complexes.

En savoir plus sur EfficientDet

YOLOv9 : Résoudre le goulot d’étranglement de l’information

Développé par des chercheurs de l'Academia Sinica, YOLOv9 la dégradation des informations lors du passage des données dans les réseaux neuronaux profonds.

  • Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica
  • Date : 21 février 2024
  • Liens :Arxiv, GitHub, Docs

Principales caractéristiques architecturales : YOLOv9 les informations de gradient programmables (PGI) pour fournir une supervision auxiliaire, garantissant ainsi la conservation des données cruciales pour la mise à jour fiable des poids du réseau. Il dispose également du réseau d'agrégation de couches généralisé et efficace (GELAN) pour maximiser l'efficacité des paramètres. Malgré ces avancées, YOLOv9 nécessite YOLOv9 une suppression non maximale (NMS) pendant le post-traitement, ce qui ajoute de la latence.

En savoir plus sur YOLOv9

Comparaison des performances

Lors de l'évaluation de ces modèles, l'analyse des données empiriques permet de déterminer quelle architecture offre le meilleur compromis pour vos besoins matériels spécifiques.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Analyse critique

YOLOv9 un bond générationnel en termes de vitesse. Par exemple, YOLOv9e atteint un mAP de 55,6 % avec une TensorRT de 16,77 ms. À l'opposé, EfficientDet-d7 offre un mAP inférieur mAP 53,7 %, mais souffre d'une latence importante (128,07 ms), ce qui le rend extrêmement difficile à déployer pour les flux vidéo en temps réel.

Exportation de modèles pour la production

Exporter votre architecture vers des formats optimisés tels que TensorRT ou OpenVINO réduit considérablement les temps d'inférence par rapport PyTorch brutes.

Cas d'utilisation et recommandations

Le choix entre EfficientDet et YOLOv9 des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.

Quand choisir EfficientDet

EfficientDet est un choix judicieux pour :

  • Google et TPU : systèmes profondément intégrés aux API Google Vision ou à TPU , où EfficientDet dispose d'une optimisation native.
  • Recherche sur la mise à l'échelle des composés : analyse comparative académique axée sur l'étude des effets d'une mise à l'échelle équilibrée de la profondeur, de la largeur et de la résolution du réseau.
  • Déploiement mobile via TFLite: projets qui nécessitent spécifiquement l'exportation TensorFlow pour Android les appareils Linux embarqués.

Quand choisir YOLOv9

YOLOv9 recommandé pour :

  • Recherche sur les goulots d'étranglement de l'information : projets universitaires étudiant les architectures PGI (Programmable Gradient Information) et GELAN (Generalized Efficient Layer Aggregation Network).
  • Études sur l'optimisation du flux de gradient : recherches axées sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarking de détection haute précision : scénarios dans lesquels les performances élevées YOLOv9 COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Ultralytics : choisir YOLO26

Si YOLOv9 EfficientDet ont ouvert la voie, les développeurs à la recherche d'un framework véritablement moderne et prêt à l'emploi devraient s'intéresser YOLO Ultralytics , en particulier au tout nouveau YOLO26.

Ultralytics offre une facilité d'utilisation inégalée, combinant de puissants scripts d'entraînement locaux avec une interface compatible avec le cloud. YOLO26 représente une refonte majeure de la conception des modèles, rendant les anciennes architectures obsolètes pour de nombreuses applications commerciales.

Points forts techniques du YOLO26

  • Conception NMS de bout en bout : YOLO26 élimine complètement les goulots d'étranglement liés au post-traitement. En supprimant la suppression non maximale, les graphiques de déploiement sont unifiés et intrinsèquement plus rapides sur les puces IA de pointe.
  • CPU jusqu'à 43 % plus rapide : fortement optimisé pour les appareils embarqués, ce qui le rend nettement plus rapide que YOLOv9 EfficientDet lorsque les GPU ne sont pas disponibles.
  • Optimiseur MuSGD : intégrant les innovations LLM dans l'IA visuelle, cet optimiseur hybride stabilise les cycles d'entraînement, permettant aux modèles de converger plus rapidement avec moins de ressources.
  • Faible consommation de mémoire : contrairement aux architectures à transformateurs lourds ou aux CNN non optimisés, YOLO26 minimise la consommation CUDA pendant l'entraînement, ce qui vous permet d'utiliser des lots plus volumineux sur du matériel grand public.
  • ProgLoss + STAL : la conception supérieure de la fonction de perte améliore considérablement la précision de la détection des petits objets, ce qui rend YOLO26 idéal pour l'imagerie aérienne et les réseaux IoT.
  • Suppression DFL : la conception structurelle simplifiée permet une conversion sans friction vers des formats de déploiement mobiles.

En savoir plus sur YOLO26

Parmi les autres options robustes de Ultralytics , on peut citer YOLO11 et YOLOv8, qui offrent également une polyvalence multitâche telle que la segmentation d'instances et l'estimation de poses.

Formation simplifiée avec le Python

Ultralytics accordent la priorité à l'expérience des développeurs. La formation d'un modèle de pointe est condensée en quelques lignes de Python.

from ultralytics import YOLO

# Initialize the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train with optimized memory usage and built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance easily
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

Applications concrètes

Le choix entre ces architectures dépend fortement de votre objectif de déploiement.

  • Déploiements cloud hérités : EfficientDet était populaire pour le traitement par lots hors ligne basé sur le cloud, où une grande précision était nécessaire et où il n'existait aucune contrainte stricte en matière de temps réel.
  • Recherche universitaire : YOLOv9 un choix intéressant pour les chercheurs qui repoussent les limites théoriques des CNN et analysent les flux de gradients à travers les couches du réseau.
  • Edge Computing et IoT :YOLO26 domine les applications du monde réel. Son pipeline NMS et ses capacités OBB (Oriented Bounding Box) en font l'option idéale pour l'analyse du trafic dans les villes intelligentes, la surveillance des stocks dans le commerce de détail et l'inspection par drone, offrant un équilibre imbattable entre haute précision et vitesses d'inférence rapides.

Commentaires