Passer au contenu

YOLOv9 vs YOLOv5 : Une comparaison détaillée

Cette page fournit une comparaison technique entre deux modèles de détection d'objets importants : YOLOv9 et Ultralytics YOLOv5. Les deux modèles font partie de la série influente YOLO (You Only Look Once), connue pour son équilibre entre vitesse et précision dans la détection d'objets en temps réel. Cette comparaison explore leurs différences architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux afin de vous aider à sélectionner le modèle le plus approprié pour vos projets de vision par ordinateur.

YOLOv9 : Amélioration de la précision avec une nouvelle architecture

YOLOv9 a été introduit en février 2024, apportant d’importantes innovations architecturales au premier plan de la détection d’objets. Il vise à résoudre le problème de la perte d’informations dans les réseaux neuronaux profonds, un défi essentiel pour la formation de modèles très efficaces.

Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
Date : 2024-02-21
Arxiv : https://arxiv.org/abs/2402.13616
GitHub : https://github.com/WongKinYiu/yolov9
Documentation : https://docs.ultralytics.com/models/yolov9/

Architecture et innovations

YOLOv9 introduit deux concepts révolutionnaires détaillés dans son article, "YOLOv9 : Apprendre ce que vous voulez apprendre en utilisant l'information de gradient programmable" :

  • Informations de gradient programmables (PGI) : Cette approche novatrice est conçue pour s'attaquer au problème du goulot d'étranglement de l'information qui se produit lorsque les données circulent dans les couches de réseaux profonds. PGI garantit que des informations d'entrée complètes sont disponibles pour calculer la fonction de perte, préservant ainsi les données cruciales pour des mises à jour de gradient plus précises et une formation de modèle plus efficace.
  • Generalized Efficient Layer Aggregation Network (GELAN) : YOLOv9 comprend également GELAN, une nouvelle architecture de réseau optimisée pour une utilisation supérieure des paramètres et une efficacité computationnelle. Il s'appuie sur les principes de CSPNet et ELAN pour créer une structure qui atteint une plus grande précision avec moins de paramètres et de coûts de calcul (FLOPs).

Points forts

  • Précision améliorée : YOLOv9 établit une nouvelle référence sur l’ensemble de données COCO, surpassant de nombreux détecteurs d’objets en temps réel précédents en matière de précision moyenne (mAP).
  • Amélioration de l'efficacité : La combinaison de PGI et de GELAN donne des modèles qui sont non seulement très précis, mais aussi efficaces sur le plan du calcul, ce qui les rend puissants pour les tâches où la performance est essentielle.
  • Préservation de l'information : En s'attaquant directement au goulot d'étranglement de l'information, PGI permet la formation de réseaux plus profonds et plus complexes sans la dégradation typique des performances, ce qui conduit à des modèles plus robustes.

Faiblesses

  • Ressources d'entraînement : Comme indiqué dans la documentation YOLOv9, l'entraînement des modèles YOLOv9 peut nécessiter plus de ressources et de temps que les modèles plus établis comme YOLOv5.
  • Écosystème plus récent : Étant un modèle plus récent provenant d'un groupe de recherche différent, son écosystème, le soutien de la communauté et les intégrations de tiers sont moins matures que ceux de l'Ultralytics YOLOv5 bien établi.
  • Polyvalence des tâches : Le YOLOv9 original se concentre principalement sur la détection d’objets. Il ne prend pas en charge nativement d’autres tâches de vision telles que la segmentation d’instance, la classification d’images et l’estimation de pose, qui sont prises en charge nativement dans les modèles Ultralytics.

Cas d'utilisation

  • Applications exigeant la plus haute précision possible en matière de détection d'objets, telles que l'analyse vidéo avancée et l'inspection industrielle de haute précision.
  • Scénarios où l'efficacité de calcul doit être équilibrée avec des performances de premier ordre, comme dans l'IA pour la gestion du trafic.
  • Recherche et développement en vision artificielle avancée où l'exploration de nouvelles architectures est une priorité.

En savoir plus sur YOLOv9

Ultralytics YOLOv5 : la norme établie et polyvalente

Lancé en 2020, Ultralytics YOLOv5 est rapidement devenu une norme industrielle en raison de son équilibre exceptionnel entre vitesse, précision et facilité d'utilisation. Développé entièrement en PyTorch, il a été continuellement affiné et est soutenu par un écosystème robuste.

Auteur : Glenn Jocher
Organisation : Ultralytics
Date : 2020-06-26
GitHub : https://github.com/ultralytics/yolov5
Documentation : https://docs.ultralytics.com/models/yolov5/

Architecture et fonctionnalités

YOLOv5 utilise une architecture éprouvée comprenant un backbone CSPDarknet53 et un neck PANet pour une agrégation efficace des caractéristiques. Sa tête de détection basée sur des ancres est très performante. Le modèle est disponible en différentes tailles (n, s, m, l, x), permettant aux développeurs de choisir le compromis parfait entre performance et contraintes de ressources.

Points forts

  • Vitesse et efficacité exceptionnelles : YOLOv5 est hautement optimisé pour une inférence rapide, ce qui le rend idéal pour les applications en temps réel sur une large gamme de matériels, des GPU puissants aux appareils périphériques aux ressources limitées.
  • Facilité d'utilisation : Reconnu pour son expérience utilisateur simplifiée, YOLOv5 offre des interfaces Python et CLI simples, ainsi qu'une documentation exhaustive et claire.
  • Écosystème bien maintenu : YOLOv5 bénéficie de l'écosystème complet d'Ultralytics, qui comprend un développement actif, une communauté large et solidaire sur Discord, des mises à jour fréquentes et des outils puissants tels que Ultralytics HUB pour l'entraînement et le déploiement sans code.
  • Équilibre des performances : Il permet un bon compromis entre la vitesse d’inférence et la précision de la détection, ce qui le rend adapté à un large éventail de scénarios de déploiement dans le monde réel.
  • Polyvalence : Contrairement à de nombreux modèles spécialisés, YOLOv5 prend en charge plusieurs tâches prêtes à l'emploi, notamment la détection d'objets, la segmentation d'instance et la classification d'images.
  • Efficacité de l'entraînement : YOLOv5 offre des processus d'entraînement efficaces, des poids pré-entraînés facilement disponibles et des besoins en mémoire généralement inférieurs à ceux de nombreuses autres architectures, en particulier les modèles basés sur des transformateurs.

Faiblesses

  • Précision maximale : Bien que très précis pour son époque, les modèles plus récents comme YOLOv9 peuvent atteindre des scores mAP plus élevés sur des benchmarks comme COCO.
  • Conception basée sur les ancres : Elle repose sur des boîtes d'ancrage prédéfinies, ce qui peut nécessiter plus de réglages pour les ensembles de données avec des objets de forme inhabituelle par rapport aux approches modernes sans ancres.

Cas d'utilisation

En savoir plus sur YOLOv5

Performances et analyses comparatives : YOLOv9 vs. YOLOv5

La comparaison des performances entre YOLOv9 et YOLOv5 met en évidence les avancées de l'architecture des modèles au fil des ans. Les modèles YOLOv9 atteignent systématiquement des scores mAP plus élevés que leurs homologues YOLOv5, souvent avec une utilisation plus efficace des paramètres et des FLOPs à l'extrémité supérieure. Par exemple, YOLOv9-C atteint 53,0 % de mAP avec 25,3 millions de paramètres, surpassant les 50,7 % de mAP de YOLOv5x avec 86,7 millions de paramètres.

Cependant, YOLOv5 excelle en termes de vitesse, en particulier ses variantes plus petites comme YOLOv5n et YOLOv5s, qui offrent des temps d'inférence extrêmement rapides sur CPU et GPU, ce qui les rend imbattables pour de nombreuses applications périphériques en temps réel.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusion : Quel modèle devriez-vous choisir ?

Le choix entre YOLOv9 et YOLOv5 dépend fortement des besoins spécifiques de votre projet.

  • YOLOv9 est le choix supérieur pour les applications où la précision maximale est l'objectif principal, et vous disposez de ressources de calcul suffisantes pour l'entraînement. Son architecture innovante le rend idéal pour repousser les limites des performances de détection d'objets dans des domaines spécialisés.

  • Ultralytics YOLOv5 reste l’option la plus pratique et la plus polyvalente pour un éventail plus large d’applications. Ses principaux avantages—facilité d’utilisation, vitesse, prise en charge multitâche et un écosystème mature et bien pris en charge—en font le modèle de choix pour les développeurs qui ont besoin de créer des solutions robustes et réelles rapidement et efficacement. Pour les projets nécessitant un déploiement sur des appareils périphériques ou un équilibre entre vitesse et précision, YOLOv5 est souvent le choix optimal.

Pour ceux qui recherchent un juste milieu ou des fonctionnalités encore plus avancées, Ultralytics propose une gamme complète de modèles. Pensez à explorer YOLOv8, qui combine de nombreux avantages d'utilisation de YOLOv5 avec une architecture sans ancrage et une polyvalence encore plus grande, ou le dernier YOLO11 pour des performances de pointe au sein de l'écosystème Ultralytics. Vous pouvez trouver plus de comparaisons sur notre page de comparaison de modèles.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires