Passer au contenu

YOLOv9 vs. YOLOv10 : une comparaison technique pour la détection d'objets

Choisir le bon modèle de détection d'objets est une décision essentielle pour tout projet de vision par ordinateur, car elle influence directement les performances, la vitesse et l'efficacité des ressources. La série YOLO continue de repousser les limites du possible. Cette page offre une comparaison technique détaillée entre deux modèles de pointe : YOLOv9 et YOLOv10. Nous analyserons leurs innovations architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux afin de vous aider à choisir le meilleur modèle pour vos besoins spécifiques, en équilibrant des facteurs tels que la précision, la vitesse d'inférence et le coût de calcul.

YOLOv9 : Information de gradient programmable pour un apprentissage amélioré

YOLOv9, introduit en février 2024, est une avancée significative dans la détection d'objets qui s'attaque au problème de la perte d'informations dans les réseaux neuronaux profonds. Son architecture novatrice garantit que les données cruciales sont préservées dans l'ensemble du modèle, ce qui conduit à des résultats très précis.

Détails techniques :

Architecture et principales fonctionnalités

YOLOv9 introduit deux concepts révolutionnaires:

  • Informations de gradient programmables (PGI) : Ce mécanisme s'attaque au défi de la perte d'informations lorsque les données circulent dans les couches de réseaux profonds. En générant des gradients fiables, PGI garantit que le modèle peut apprendre efficacement et effectuer des mises à jour précises, ce qui est essentiel pour détecter des objets complexes.
  • Generalized Efficient Layer Aggregation Network (GELAN) : YOLOv9 présente une nouvelle architecture de réseau, GELAN, qui est une conception très efficace qui optimise l'utilisation des paramètres et l'efficacité computationnelle. Cela permet à YOLOv9 d'atteindre des performances de premier ordre sans être excessivement grand ou lent.

Points forts

  • Haute précision : YOLOv9 établit une norme élevée en matière de précision, sa plus grande variante, YOLOv9-E, atteignant des scores mAP à la pointe de la technologie sur l’ensemble de données COCO.
  • Préservation de l'information : L'innovation principale de PGI atténue efficacement le problème du goulot d'étranglement de l'information, ce qui améliore l'apprentissage et les performances du modèle.
  • Architecture efficace : GELAN offre un excellent équilibre entre vitesse et précision, ce qui rend YOLOv9 très compétitif en termes de performances par paramètre.
  • Écosystème Ultralytics : Lorsqu’il est utilisé dans le framework Ultralytics, YOLOv9 bénéficie d’une expérience utilisateur simplifiée, d’une API Python simple et d’une documentation exhaustive. L’écosystème garantit un entraînement efficace avec des poids pré-entraînés facilement disponibles, un développement actif, un soutien communautaire fort et généralement des besoins en mémoire plus faibles par rapport à d’autres types de modèles comme les transformateurs.

Faiblesses

  • Nouveau modèle : En tant que version récente, l'étendue des exemples proposés par la communauté et des intégrations de tiers est toujours en croissance par rapport aux modèles plus établis.
  • Complexité : Le nouveau concept de PGI, bien que puissant, ajoute une couche de complexité architecturale par rapport aux conceptions plus simples.

Cas d'utilisation idéaux

YOLOv9 est un excellent choix pour les applications où l’obtention de la plus grande précision possible est l’objectif principal :

En savoir plus sur YOLOv9

YOLOv10 : Efficacité en temps réel de bout en bout

YOLOv10, publié en mai 2024 par des chercheurs de l'Université Tsinghua, est conçu pour une efficacité et une vitesse maximales. Il y parvient en redéfinissant les composants clés de l'architecture YOLO et, plus particulièrement, en éliminant le besoin de post-traitement de suppression non maximale (NMS).

Détails techniques :

Architecture et principales fonctionnalités

La philosophie de conception de YOLOv10 est axée sur l'efficacité de bout en bout :

  • Formation sans NMS : YOLOv10 utilise des affectations doubles cohérentes pendant la formation, ce qui lui permet de produire des prédictions propres sans l’étape NMS. Cela réduit considérablement la latence d’inférence et simplifie le pipeline de déploiement.
  • Conception holistique axée sur l’efficacité et la précision : L’architecture du modèle a été optimisée de haut en bas. Cela comprend une tête de classification légère, un sous-échantillonnage spatial-canal découplé pour préserver efficacement l’information et une conception de bloc guidée par le rang pour éliminer la redondance de calcul.

Points forts

  • Efficacité et vitesse extrêmes : Optimisé pour une latence et un coût de calcul minimaux, ce qui en fait l'un des détecteurs d'objets les plus rapides disponibles.
  • Déploiement de bout en bout : La conception sans NMS supprime la surcharge de post-traitement, permettant une véritable détection de bout en bout en une seule étape.
  • Excellent rapport performance/watt : Son faible encombrement en termes de calcul et de mémoire le rend idéal pour les appareils à faible consommation d’énergie.
  • Intégration Ultralytics : YOLOv10 est entièrement intégré à l’écosystème Ultralytics, offrant aux utilisateurs une plateforme bien maintenue et facile à utiliser. Cela comprend une API simple, une documentation complète et un accès à la suite complète d’outils Ultralytics.

Faiblesses

  • Modèle très récent : En tant que modèle le plus récent de la série, les ressources communautaires et les exemples de déploiement dans le monde réel sont encore en cours d'accumulation.
  • Spécialisation de tâche : YOLOv10 est hautement spécialisé dans la détection d’objets. Il ne possède pas la polyvalence intégrée pour d’autres tâches telles que la segmentation d’instance ou l’estimation de pose qui sont natives des modèles tels que Ultralytics YOLOv8.

Cas d'utilisation idéaux

YOLOv10 excelle dans les applications où les performances et l'efficacité en temps réel sont essentielles :

  • Edge Computing : Parfait pour un déploiement sur des appareils aux ressources limitées comme NVIDIA Jetson et les plateformes mobiles.
  • Analyse vidéo à haute vitesse : Applications nécessitant une détection immédiate d'objets dans les flux vidéo, telles que la surveillance du trafic ou l'analyse de sports en direct.
  • Systèmes mobiles et embarqués : Intégration dans les applications où la vitesse et la consommation d’énergie sont des facteurs cruciaux pour l’expérience utilisateur.

En savoir plus sur YOLOv10

Comparaison des performances : YOLOv9 contre YOLOv10

La principale différence entre YOLOv9 et YOLOv10 réside dans leurs priorités de conception. YOLOv9 se concentre sur la maximisation de la précision grâce à des conceptions architecturales sophistiquées, tandis que YOLOv10 est conçu pour une efficacité de calcul inégalée et une faible latence.

Le tableau ci-dessous montre que, bien que le plus grand modèle, YOLOv9-E, atteigne le mAP global le plus élevé, les modèles YOLOv10 offrent systématiquement une meilleure vitesse et une meilleure efficacité des paramètres à des niveaux de précision comparables. Par exemple, YOLOv10-B a 46 % de latence en moins et 25 % de paramètres en moins que YOLOv9-C pour des performances similaires. Cela fait de YOLOv10 un choix extrêmement judicieux pour les applications où la vitesse d'inférence est un goulot d'étranglement critique.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Conclusion : Quel modèle devriez-vous choisir ?

Votre choix entre YOLOv9 et YOLOv10 dépend entièrement des priorités de votre projet.

  • Choisissez YOLOv9 si votre exigence principale est la précision maximale. Elle est idéale pour les tâches complexes où la précision est non négociable et où vous pouvez supporter une surcharge de calcul légèrement plus élevée.

  • Choisissez YOLOv10 si votre exigence principale est la vitesse et l'efficacité en temps réel. Son architecture sans NMS en fait le choix idéal pour les applications à faible latence et le déploiement sur du matériel aux ressources limitées.

Les deux modèles représentent le summum de la détection d'objets et sont d'excellents choix dans leurs domaines respectifs. Leur intégration dans l'écosystème Ultralytics garantit que les développeurs et les chercheurs peuvent exploiter ces outils puissants avec facilité et un support robuste.

Explorer d'autres modèles

Pour les utilisateurs dont les besoins ne s'alignent pas parfaitement avec YOLOv9 ou YOLOv10, l'écosystème Ultralytics offre d'autres alternatives puissantes. Ultralytics YOLOv8 reste un excellent choix pour son équilibre exceptionnel entre performance et polyvalence, prenant en charge des tâches telles que la segmentation, la classification et l'estimation de pose prêtes à l'emploi. Pour ceux qui recherchent les toutes dernières avancées, Ultralytics YOLO11 s'appuie sur ses prédécesseurs pour établir de nouvelles références en matière de performance et d'efficacité. Vous pouvez explorer d'autres comparaisons, telles que YOLOv9 vs. YOLOv8 et YOLOv8 vs. YOLOv10, afin de trouver le modèle parfait pour votre projet.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires