Passer au contenu

YOLOv9 vs YOLO11 : Une comparaison technique

Le domaine de la détection d'objets en temps réel est en constante évolution, avec de nouveaux modèles qui repoussent les limites du possible. Cette page offre une comparaison technique approfondie entre deux concurrents puissants : YOLOv9, un modèle connu pour ses innovations architecturales, et Ultralytics YOLO11, le dernier modèle à la pointe de la technologie d'Ultralytics. Nous analyserons leurs architectures, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à sélectionner le modèle optimal pour vos projets de vision par ordinateur.

YOLOv9 : Amélioration de la précision avec une nouvelle architecture

YOLOv9 a été introduit comme une avancée significative dans la détection d’objets, principalement axée sur la résolution du problème de la perte d’informations dans les réseaux neuronaux profonds. Ses nouveaux composants architecturaux visent à atteindre une plus grande précision en préservant davantage de données dans l’ensemble du modèle.

Détails techniques :

Architecture et principales fonctionnalités

Les principales innovations de YOLOv9 sont Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN). PGI est conçu pour fournir des informations d’entrée complètes à la fonction de perte, atténuant ainsi le problème des goulots d’étranglement de l’information qui peuvent nuire aux performances dans les réseaux très profonds. GELAN est une architecture de réseau légère et efficace qui optimise l’utilisation des paramètres et l’efficacité du calcul. Ensemble, ces caractéristiques permettent à YOLOv9 d’établir des normes de haute précision sur des ensembles de données comme COCO.

Points forts

  • Haute précision : Obtient des résultats à la pointe de la technologie sur l'ensemble de données COCO, avec sa plus grande variante, YOLOv9-E, atteignant un mAP élevé.
  • Préservation de l'information : PGI s'attaque efficacement au problème du goulot d'étranglement de l'information, qui est crucial pour la formation de modèles profonds et complexes.
  • Conception efficace : L'architecture GELAN offre un rapport précision/paramètre élevé.

Faiblesses

  • Polyvalence des tâches : La recherche originale sur YOLOv9 se concentre principalement sur la détection d’objets. Elle ne prend pas en charge nativement d’autres tâches telles que la segmentation d’instance, l’estimation de pose et la classification, contrairement aux modèles Ultralytics.
  • Écosystème et facilité d'utilisation : En tant que modèle provenant d'un groupe de recherche distinct, son écosystème est moins mature. L'intégration dans les flux de travail de production peut être plus complexe, et il ne possède pas l'expérience utilisateur simplifiée, la documentation exhaustive et le soutien communautaire actif fournis par Ultralytics.
  • Ressources d'entraînement : Comme indiqué dans sa documentation, l'entraînement de YOLOv9 peut nécessiter plus de ressources et de temps que les modèles hautement optimisés comme ceux d'Ultralytics.

En savoir plus sur YOLOv9

Ultralytics YOLO11 : Le summum de la performance et de la convivialité

Ultralytics YOLO11 est le dernier modèle phare d'Ultralytics, conçu pour offrir un équilibre exceptionnel entre vitesse, précision et polyvalence. S'appuyant sur le succès de ses prédécesseurs comme YOLOv8, YOLO11 est conçu pour un large éventail d'applications du monde réel et est optimisé pour la facilité d'utilisation et le déploiement sur diverses plateformes matérielles.

Détails techniques :

Architecture et principales fonctionnalités

YOLO11 affine l'architecture éprouvée des modèles Ultralytics précédents, en intégrant une extraction de caractéristiques avancée et une conception de réseau simplifiée. Il en résulte une plus grande précision avec moins de paramètres et d'exigences de calcul. L'avantage clé de YOLO11 ne réside pas seulement dans ses performances, mais dans son intégration dans l'écosystème Ultralytics complet. Cela offre plusieurs avantages clés :

  • Facilité d'utilisation : Une API Python et une CLI simples et intuitives facilitent la tâche aux débutants comme aux experts pour entraîner, valider et déployer des modèles.
  • Écosystème bien maintenu : YOLO11 bénéficie d'un développement actif, de mises à jour fréquentes et d'un fort soutien de la communauté. Il s'intègre de manière transparente avec des outils tels que Ultralytics HUB pour l'entraînement sans code et le MLOps.
  • Polyvalence : YOLO11 est un modèle multitâche qui prend en charge la détection d'objets, la segmentation d'instance, la classification d'images, l'estimation de pose et les boîtes englobantes orientées (OBB) au sein d'un framework unifié unique.
  • Efficacité de l'entraînement et de la mémoire : YOLO11 est hautement optimisé pour un entraînement efficace, avec des poids pré-entraînés facilement disponibles. Il nécessite généralement moins de mémoire pour l'entraînement et l'inférence par rapport à d'autres types de modèles, en particulier les grands modèles basés sur des transformateurs.

Points forts

  • Excellent compromis de performance : Offre un compromis supérieur entre vitesse et précision, ce qui le rend idéal pour l’inférence en temps réel.
  • Prise en charge multi-tâches : Un seul modèle peut gérer une grande variété de tâches de vision par ordinateur, ce qui augmente son utilité et réduit la complexité du développement.
  • Optimisation matérielle : Optimisé pour le déploiement sur divers matériels, des appareils périphériques aux serveurs cloud, avec d’excellentes performances sur le CPU et le GPU.
  • Robuste et éprouvé : Bénéficie d’années de recherche et développement, assurant la stabilité et la fiabilité pour les environnements de production.

Faiblesses

  • En tant que détecteur à une étape, il peut rencontrer des difficultés avec les objets extrêmement petits ou regroupés par rapport à certains détecteurs spécialisés à deux étapes.
  • Les plus grands modèles YOLO11, bien qu'efficaces, nécessitent toujours une puissance de calcul substantielle pour des performances maximales.

En savoir plus sur YOLO11

Comparaison des performances : YOLOv9 vs. YOLO11

Lorsqu'on compare les performances, il est clair que les deux modèles sont très performants. YOLOv9-E atteint le mAP le plus élevé sur l'ensemble de données COCO, mais cela se fait au prix d'une latence plus élevée. En revanche, la famille Ultralytics YOLO11 offre une gamme d'options plus équilibrée et plus pratique. Par exemple, YOLO11l atteint un mAP comparable à YOLOv9c, mais avec une vitesse d'inférence GPU plus rapide. De plus, les modèles plus petits comme YOLO11n et YOLO11s offrent des performances en temps réel exceptionnelles, ce qui les rend beaucoup plus adaptés aux applications aux ressources limitées.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Cas d'utilisation idéaux

YOLOv9

YOLOv9 est mieux adapté aux projets axés sur la recherche ou aux applications où l’obtention de la précision de détection maximale absolue est l’objectif principal, et où des facteurs tels que la facilité d’utilisation, la fonctionnalité multitâche et le temps d’entraînement sont secondaires.

  • Recherche avancée : Explorer les limites des architectures d’apprentissage profond.
  • Systèmes de haute précision : Applications telles que la conduite autonome ou l'analyse d’images médicales spécialisée où une mAP de premier ordre est essentielle.

Ultralytics YOLO11

YOLO11 est le choix idéal pour la grande majorité des applications du monde réel, du prototypage rapide au déploiement de production à grande échelle. Sa combinaison de performance, de polyvalence et de facilité d'utilisation en fait une solution globale supérieure.

Bien que YOLOv9 soit un modèle louable qui introduit d'importants concepts académiques, Ultralytics YOLO11 se distingue comme le choix le plus pratique, puissant et polyvalent pour les développeurs et les chercheurs.

L'accent mis par YOLOv9 sur la précision pure est impressionnant, mais YOLO11 offre des performances très compétitives tout en offrant une expérience utilisateur largement supérieure, des capacités multitâches et un écosystème robuste et bien pris en charge. Pour les projets qui doivent passer efficacement du concept à la production, le flux de travail simplifié de YOLO11, sa documentation complète et sa communauté active offrent un avantage inégalé. Son approche équilibrée de la vitesse et de la précision vous permet de trouver le modèle parfait pour toute application, des appareils périphériques légers aux puissants serveurs cloud.

Pour ces raisons, Ultralytics YOLO11 est le choix définitif pour la construction de la prochaine génération de solutions de vision par ordinateur basées sur l'IA.

Explorer d'autres modèles

Si vous souhaitez savoir comment YOLO11 et YOLOv9 se comparent à d'autres modèles de l'écosystème, n'oubliez pas de consulter nos autres pages de comparaison. Des modèles comme YOLOv10 et RT-DETR offrent différents compromis en termes de performances et d'architecture qui pourraient être pertinents pour vos besoins spécifiques. Explorez notre page principale de comparaison de modèles pour une vue d'ensemble complète.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires