Passer au contenu

YOLO11 vs YOLOv9 : Une comparaison technique pour la détection d'objets

Ultralytics fournit constamment des modèles YOLO de pointe, repoussant les limites de la détection d'objets en temps réel. Cette page fournit une comparaison technique entre deux modèles avancés : Ultralytics YOLO11 et YOLOv9. Nous analysons leurs innovations architecturales, leurs performances et leurs applications appropriées afin de vous guider dans la sélection du modèle optimal pour vos tâches de vision par ordinateur.

Ultralytics YOLO11 : La pointe de la technologie

Ultralytics YOLO11, la plus récente itération de la série Ultralytics YOLO, s'appuie sur les succès précédents tels que YOLOv8. YOLO11 est conçu pour une précision et une efficacité accrues dans diverses tâches de vision par ordinateur, notamment la détection d'objets, la segmentation d'instance, la classification d'images et l'estimation de pose.

Détails techniques :

Architecture et principales fonctionnalités

YOLO11 dispose d'une architecture conçue pour améliorer l'extraction des caractéristiques et accélérer le traitement. Il atteint une plus grande précision, souvent avec moins de paramètres que ses prédécesseurs, ce qui améliore les performances en temps réel et permet un déploiement sur diverses plateformes, des appareils périphériques tels que NVIDIA Jetson et Raspberry Pi à l'infrastructure cloud. Un avantage clé de YOLO11 est son intégration transparente dans l'écosystème Ultralytics bien maintenu, offrant une expérience utilisateur simplifiée grâce à une simple API Python et une documentation exhaustive. Cet écosystème garantit un entraînement efficace avec des poids pré-entraînés facilement disponibles et bénéficie d'un développement actif, d'un solide support communautaire via GitHub et Discord, et de mises à jour fréquentes. De plus, YOLO11 fait preuve de polyvalence en prenant en charge de multiples tâches de vision au-delà de la détection, une caractéristique souvent absente des modèles concurrents. Il nécessite également généralement moins de mémoire pendant l'entraînement et l'inférence par rapport à d'autres types de modèles comme les transformateurs.

Points forts

  • Équilibre des performances : Excellent compromis entre vitesse et précision.
  • Facilité d'utilisation : API simple, documentation complète et écosystème intégré (Ultralytics HUB).
  • Polyvalence : Prend en charge les tâches de détection, de segmentation, de classification, de pose et d’OBB.
  • Efficacité : Optimisé pour divers matériels, entraînement efficace et faible encombrement mémoire.
  • Bien maintenu : Activement développé, fort soutien communautaire et mises à jour fréquentes.

Faiblesses

  • En tant que détecteur à une étape, peut rencontrer des difficultés avec les objets extrêmement petits par rapport à certains détecteurs à deux étapes.
  • Les modèles plus grands nécessitent plus de ressources de calcul, bien que généralement moins que les modèles basés sur des transformateurs.

Cas d'utilisation idéaux

YOLO11 est idéal pour les applications exigeant une haute précision et un traitement en temps réel :

En savoir plus sur YOLO11

YOLOv9 : Amélioration de la précision avec de nouveaux concepts

YOLOv9, introduit au début de 2024, représente une contribution académique significative à la détection d'objets, en se concentrant sur la résolution de la perte d'informations dans les réseaux neuronaux profonds.

Détails techniques :

Architecture et principales fonctionnalités

YOLOv9 introduit deux innovations architecturales majeures : l’information de gradient programmable (PGI) et le réseau d’agrégation de couches efficace généralisé (GELAN). La PGI est conçue pour fournir des informations d’entrée complètes pour le calcul de la fonction de perte, atténuant ainsi le problème de goulot d’étranglement de l’information qui peut dégrader les performances dans les réseaux profonds. GELAN est une nouvelle architecture de réseau très efficace qui optimise l’utilisation des paramètres et l’efficacité du calcul. Ensemble, ces caractéristiques permettent à YOLOv9 d’établir de nouvelles références en matière de précision sur l’ensemble de données COCO.

Points forts

  • Précision améliorée : Établit de nouveaux résultats de pointe sur l’ensemble de données COCO pour les détecteurs d’objets en temps réel, surpassant de nombreux modèles précédents en mAP.
  • Amélioration de l'efficacité : GELAN et PGI contribuent à des modèles qui nécessitent moins de paramètres et de ressources de calcul (FLOPs) pour des performances comparables ou meilleures.
  • Préservation de l'information : PGI s'attaque efficacement au problème du goulot d'étranglement de l'information, qui est crucial pour la formation précise de réseaux plus profonds et plus complexes.

Faiblesses

  • Ressources d'entraînement : L'entraînement des modèles YOLOv9 peut nécessiter plus de ressources et de temps que Ultralytics YOLOv5, comme indiqué dans la documentation YOLOv9.
  • Architecture plus récente : Étant un modèle plus récent provenant d'un groupe de recherche différent, son écosystème, le soutien de la communauté et les intégrations de tiers sont moins matures que l'écosystème Ultralytics bien établi.
  • Polyvalence des tâches : Principalement axé sur la détection d'objets, sans la prise en charge intégrée de la segmentation, de la classification et de l'estimation de la pose que l'on trouve dans les modèles Ultralytics tels que YOLO11 et YOLOv8.

Cas d'utilisation idéaux

YOLOv9 est bien adapté aux applications où l’obtention de la plus grande précision possible de détection d’objets est l’objectif principal :

  • Analyse vidéo avancée : Suivi et analyse de haute précision dans des scènes complexes.
  • Inspection industrielle de haute précision : Détection de défauts minimes dans la fabrication.
  • Recherche et évaluation comparative : Repousser les limites de la précision de la détection sur des ensembles de données standard.

En savoir plus sur YOLOv9

Comparaison directe des performances : YOLO11 contre YOLOv9

YOLO11 et YOLOv9 offrent tous deux une gamme de tailles de modèles, permettant aux développeurs de trouver le juste équilibre entre vitesse et précision pour leurs besoins spécifiques. Le tableau suivant fournit une comparaison directe de leurs mesures de performance sur l'ensemble de données COCO.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

D'après les données, nous pouvons constater que les modèles YOLO11 offrent un équilibre exceptionnel en termes de performances. Par exemple, YOLO11s atteint un mAP plus élevé que YOLOv9s avec moins de FLOPs. De même, YOLO11l surpasse YOLOv9c en précision tout en ayant des FLOPs nettement inférieurs et une vitesse d'inférence GPU plus rapide. Bien que le plus grand modèle YOLOv9-E atteigne le mAP le plus élevé, YOLO11 offre un compromis plus pratique sur toute sa gamme de modèles, en particulier si l'on considère les benchmarks de vitesse complets et la facilité de déploiement fournis par le framework Ultralytics.

Différences architecturales et d'écosystème

La différence fondamentale réside dans leur philosophie de conception. Ultralytics YOLO11 est conçu pour les praticiens. Son architecture est optimisée non seulement pour la performance, mais aussi pour la convivialité, la polyvalence et l'intégration. Le framework unifié prend en charge plusieurs tâches prêtes à l'emploi, ce qui réduit considérablement le temps de développement des systèmes d'IA complexes. L'écosystème environnant, y compris Ultralytics HUB, une documentation complète et une communauté active, en fait le choix idéal pour la création et le déploiement d'applications prêtes à la production.

YOLOv9, d'autre part, est un modèle axé sur la recherche qui introduit des concepts académiques révolutionnaires. Sa force réside dans son approche novatrice pour résoudre les défis de l'apprentissage profond comme la perte d'informations. Bien que puissant, cet accent signifie qu'il lui manque l'écosystème holistique et convivial pour les développeurs qui définit les modèles Ultralytics. L'intégration de YOLOv9 dans un pipeline multi-tâches ou son déploiement sur divers matériels peut nécessiter plus d'efforts manuels et d'expertise.

Conclusion : Quel modèle devriez-vous choisir ?

Pour la grande majorité des développeurs, des chercheurs et des entreprises, Ultralytics YOLO11 est le choix recommandé. Il offre une combinaison supérieure de haute performance, de vitesse, de polyvalence et de facilité d'utilisation inégalée. L'écosystème robuste et la maintenance active vous permettent de passer rapidement et efficacement du concept à la production. Sa capacité à gérer la détection, la segmentation, la classification et plus encore dans un cadre unique en fait une solution puissante et à l'épreuve du temps.

YOLOv9 est un excellent modèle pour les spécialistes et les chercheurs dont l'objectif principal est d'atteindre la précision de détection maximale absolue sur les benchmarks, et qui sont prêts à gérer les complexités supplémentaires de l'entraînement et du déploiement en dehors d'un écosystème intégré.

Explorer d'autres modèles

Le monde de la détection d'objets est en constante évolution. Outre YOLO11 et YOLOv9, vous pourriez également être intéressé par d'autres modèles puissants disponibles dans l'écosystème Ultralytics. Consultez nos comparaisons de YOLOv10, du prédécesseur YOLOv8 et du RT-DETR basé sur un transformateur afin de trouver la solution idéale pour votre projet.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires