YOLOv9 vs. EfficientDet : Une comparaison détaillée
Choisir le modèle de détection d'objets optimal est essentiel pour les tâches de vision par ordinateur, en équilibrant la précision, la vitesse et les ressources de calcul. Cette page fournit une comparaison technique détaillée entre Ultralytics YOLOv9 et EfficientDet, deux modèles importants dans le paysage de la détection d'objets. Nous examinerons en profondeur leurs conceptions architecturales, leurs benchmarks de performance et leurs applications appropriées pour vous aider à prendre une décision éclairée pour vos projets.
YOLOv9 : Précision et efficacité de pointe
YOLOv9, introduit en 2024 par Chien-Yao Wang et Hong-Yuan Mark Liao de l'Institut des sciences de l'information, Academia Sinica, Taïwan, représente une avancée significative dans la série YOLO. Il est détaillé dans leur article "YOLOv9 : Apprendre ce que vous voulez apprendre en utilisant l'information de gradient programmable" et mis en œuvre dans leur dépôt GitHub. YOLOv9 s'attaque au défi de la perte d'informations dans les réseaux profonds grâce à des éléments architecturaux innovants tels que l'information de gradient programmable (PGI) et le réseau d'agrégation de couches efficaces généralisé (GELAN). Ces innovations garantissent que le modèle apprend efficacement et maintient une haute précision avec moins de paramètres, démontrant un fort équilibre entre performance et efficacité.
Détails techniques :
- Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
- Organisation : Institute of Information Science, Academia Sinica, Taiwan
- Date : 2024-02-21
- Arxiv : https://arxiv.org/abs/2402.13616
- GitHub : https://github.com/WongKinYiu/yolov9
- Documentation : https://docs.ultralytics.com/models/yolov9/
Points forts
- Précision à la pointe de la technologie : YOLOv9 offre une précision supérieure dans la détection d'objets, surpassant souvent ses concurrents avec un nombre de paramètres similaire.
- Utilisation efficace des paramètres : Les architectures PGI et GELAN améliorent l'extraction des caractéristiques et réduisent la perte d'informations, ce qui conduit à de meilleures performances avec moins de paramètres et de FLOPs.
- Scalabilité : La famille YOLOv9 comprend différentes tailles de modèles (YOLOv9t à YOLOv9e), offrant une flexibilité pour différentes capacités de calcul.
- Écosystème Ultralytics : Bien que la recherche originale provienne d’Academia Sinica, l’intégration au sein du framework Ultralytics offre d’immenses avantages. Ceux-ci incluent la facilité d’utilisation grâce à une API Python simple, une documentation exhaustive et des processus d’entraînement efficaces avec des poids pré-entraînés facilement disponibles. L’écosystème bien maintenu garantit un développement actif, un soutien communautaire fort et une intégration avec des outils tels que Ultralytics HUB pour l’entraînement sans code.
- Faible encombrement mémoire : les modèles YOLO présentent généralement des besoins en mémoire inférieurs pendant l’entraînement par rapport à de nombreuses autres architectures, en particulier les modèles basés sur les transformateurs comme RT-DETR.
Faiblesses
- Nouveauté : En tant que modèle plus récent, les exemples de déploiement dans le monde réel peuvent être moins nombreux que pour les modèles plus anciens et établis comme EfficientDet, bien que l’adoption au sein de la communauté Ultralytics soit rapide.
- Spécificité de la tâche : L’article original de YOLOv9 se concentre principalement sur la détection d’objets. Toutefois, son intégration dans l’écosystème Ultralytics laisse entrevoir un potentiel plus large, s’alignant sur les capacités multitâches des modèles tels que Ultralytics YOLOv8.
Cas d'utilisation
YOLOv9 est particulièrement bien adapté aux applications où la précision et l’efficacité sont primordiales, telles que :
- Analyse d’images haute résolution, comme l’utilisation de la vision par ordinateur pour analyser l’imagerie satellite.
- Compréhension de scènes complexes requise dans les véhicules autonomes.
- Reconnaissance d'objets détaillée pour des tâches telles que le contrôle qualité dans la fabrication.
EfficientDet : Détection d'objets évolutive et efficace
EfficientDet a été introduit en 2019 par une équipe de Google Research. Il a proposé une nouvelle famille de détecteurs d'objets évolutifs qui privilégient l'efficacité sans sacrifier la précision. L'architecture du modèle est basée sur le backbone EfficientNet très efficace, un nouveau réseau de pyramides de caractéristiques bidirectionnelles (BiFPN) pour la fusion de caractéristiques et une méthode de mise à l'échelle composée qui met à l'échelle uniformément la résolution, la profondeur et la largeur de toutes les parties du modèle.
Détails techniques :
- Auteurs : Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organisation : Google
- Date : 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub : https://github.com/google/automl/tree/master/efficientdet
Points forts
- Scaling composite : L’innovation clé d’EfficientDet est son approche systématique du scaling, lui permettant de créer une famille de modèles (D0-D7) qui s’adaptent aux différentes contraintes de ressources.
- BiFPN : Le réseau de pyramide de caractéristiques bidirectionnel permet une fusion de caractéristiques multi-échelles plus riche par rapport aux FPN traditionnels, ce qui améliore la précision de la détection.
- Importance historique : Au moment de sa sortie, EfficientDet a établi une nouvelle norme en matière d’efficacité dans la détection d’objets, influençant de nombreuses architectures ultérieures.
Faiblesses
- Performances dépassées : Bien qu'EfficientDet ait été révolutionnaire en son temps, il a été surpassé en termes de précision et de vitesse par des modèles plus récents tels que YOLOv9. Comme le montre le tableau des performances, les modèles YOLOv9 atteignent systématiquement un mAP plus élevé avec moins de paramètres et des vitesses d'inférence nettement plus rapides.
- Inférence plus lente : Sur du matériel moderne comme le NVIDIA T4, même les plus petits modèles EfficientDet sont plus lents que les variantes YOLOv9 comparables ou plus précises.
- Écosystème limité : EfficientDet est principalement un référentiel de recherche. Il manque l’écosystème complet et convivial fourni par Ultralytics, qui comprend la formation, le déploiement et le support communautaire rationalisés.
- Spécificité de la tâche : EfficientDet est conçu uniquement pour la détection d’objets et n’offre pas la polyvalence intégrée pour d’autres tâches telles que la segmentation d’instance ou l’estimation de pose que l’on trouve dans le framework Ultralytics.
Cas d'utilisation
EfficientDet peut toujours être envisagé pour les systèmes existants ou comme base de référence pour une comparaison académique. Ses applications comprennent :
- Détection d'objets à usage général où l'inférence à haute vitesse n'est pas la contrainte principale.
- Objectifs pédagogiques pour comprendre les réseaux de pyramides de caractéristiques et les principes de mise à l'échelle des modèles.
- Projets qui ont été standardisés sur le framework TensorFlow, où réside l'implémentation d'origine.
En savoir plus sur EfficientDet
Analyse des performances : YOLOv9 vs. EfficientDet
La comparaison des performances entre YOLOv9 et EfficientDet démontre clairement les progrès réalisés dans la détection d'objets au cours des dernières années. YOLOv9 offre systématiquement un compromis supérieur entre la précision, la vitesse et la taille du modèle.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.30 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
D'après le tableau, plusieurs informations clés se dégagent :
- Précision vs. Efficacité : Le modèle YOLOv9c atteint un mAP de 53,0 avec seulement 25,3 M de paramètres et un temps d’inférence ultra-rapide de 7,16 ms sur un GPU T4. En revanche, le modèle EfficientDet-d6, d’une précision similaire (52,6 mAP), nécessite plus du double de paramètres (51,9 M) et est plus de 12 fois plus lent, à 89,29 ms.
- Performance de premier ordre : Le plus grand modèle, YOLOv9e, atteint un mAP de 55,6, surpassant même le plus grand modèle EfficientDet-d7 (53,7 mAP) tout en étant plus de 7 fois plus rapide et en nécessitant beaucoup moins de FLOP.
- Modèles légers : Dans la gamme inférieure, YOLOv9s (46,8 mAP) offre une précision comparable à EfficientDet-d3 (47,5 mAP), mais avec près de la moitié des paramètres et est plus de 5 fois plus rapide sur un GPU.
Conclusion : Quel modèle devriez-vous choisir ?
Pour presque toutes les applications modernes de détection d'objets, YOLOv9 est le grand gagnant. Son architecture avancée offre une précision de pointe tout en maintenant une vitesse d'inférence et une efficacité de paramètre exceptionnelles. L'intégration dans l'écosystème Ultralytics améliore encore sa valeur, offrant un flux de travail rationalisé de la formation au déploiement, soutenu par une documentation robuste et une communauté active.
EfficientDet reste un modèle important d'un point de vue historique et académique, pionnier des concepts de mise à l'échelle des modèles et de fusion des caractéristiques. Cependant, pour le développement et le déploiement pratiques, ses performances ont été éclipsées par des architectures plus récentes et plus efficaces comme YOLOv9. Si vous démarrez un nouveau projet ou cherchez à mettre à niveau un projet existant, choisir YOLOv9 offrira des performances supérieures, des cycles de développement plus rapides et une meilleure prise en charge des avancées futures.
Explorer d'autres modèles
Si vous explorez d'autres modèles de pointe, envisagez de consulter les comparaisons avec YOLOv10, YOLOv8 et les architectures basées sur les transformeurs comme RT-DETR. Vous trouverez des analyses plus détaillées sur notre page de comparaison des modèles.