Passer au contenu

YOLO11 vs YOLOv9: une comparaison technique complète

Dans le domaine de la vision par ordinateur, qui progresse rapidement, le choix du bon modèle de détection d'objets est essentiel pour la réussite du projet. Cette comparaison explore les nuances techniques entre Ultralytics YOLO11Ultralytics, le dernier modèle de pointe conçu pour être efficace dans le monde réel, et YOLOv9une architecture axée sur la recherche et connue pour ses innovations théoriques. Nous analysons leurs différences architecturales, leurs mesures de performance et leur adéquation à divers scénarios de déploiement.

Ultralytics YOLO11: La norme pour l'IA de production

Publié le 27 septembre 2024, par Glenn Jocher et Jing Qiu à l'adresse suivante UltralyticsYOLO11 représente l'aboutissement d'une recherche approfondie sur la conception de réseaux neuronaux efficaces. Contrairement aux modèles académiques qui privilégient souvent les mesures théoriques à l'utilisation pratique, YOLO11 est conçu pour offrir aux développeurs et aux entreprises un équilibre optimal entre la vitesse, la précision et l'efficacité des ressources.

Détails techniques :

Architecture et fonctionnalités

YOLO11 présente une architecture raffinée qui améliore l'extraction des caractéristiques tout en conservant un format compact. Il utilise une structure améliorée de l'épine dorsale et du cou, spécialement conçue pour capturer des motifs complexes avec moins de paramètres que les générations précédentes telles que YOLOv8. Cette philosophie de conception garantit que les modèles YOLO11 fonctionnent exceptionnellement bien sur du matériel aux ressources limitées, comme les appareils périphériques, sans sacrifier la capacité de détection.

L'une des particularités de YOLO11 est sa polyvalence native. Alors que de nombreux modèles sont strictement des détecteurs d'objets, YOLO11 prend en charge un large éventail de tâches de vision par ordinateur dans un cadre unique :

Points forts de la production

Pour les développeurs, le principal avantage de YOLO11 est son intégration dans l'écosystèmeUltralytics . Cela garantit une expérience utilisateur rationalisée avec une APIPython simple et une CLI complète.

Pourquoi les développeurs choisissent YOLO11

YOLO11 réduit considérablement le temps de mise sur le marché des solutions d'intelligence artificielle. Ses faibles besoins en mémoire lors de l'apprentissage et de l'inférence le rendent accessible à une plus large gamme de matériel, évitant les coûts élevés de VRAM associés aux alternatives basées sur les transformateurs.

En savoir plus sur YOLO11

YOLOv9: Résoudre les goulets d'étranglement en matière d'information

Présenté au début de l'année 2024 par Chien-Yao Wang et Hong-Yuan Mark Liao, YOLOv9 se concentre sur la résolution des défis de la théorie de l'apprentissage profond, en particulier le problème du goulot d'étranglement de l'information. Il témoigne de la rigueur académique, repoussant les limites de ce qui est possible en matière de préservation des caractéristiques.

Détails techniques :

Innovations architecturales

YOLOv9 s'articule autour de deux concepts fondamentaux : l'information de gradient programmable (PGI) et le réseau d'agrégation de couches efficace généralisé (GELAN). Le PGI vise à préserver les informations d'entrée lorsqu'elles passent par des couches profondes, en calculant un gradient fiable pour la fonction de perte. Le GELAN optimise l'utilisation des paramètres, ce qui permet au modèle d'atteindre une grande précision sur l'ensemble de donnéesCOCO par rapport à sa taille.

Performances et compromis

YOLOv9 excelle dans les tests de précision brute, et sa plus grande variante, YOLOv9, obtient des scores mAP impressionnants. Toutefois, cette orientation académique peut se traduire par une plus grande complexité dans le déploiement. Bien que puissante, l'implémentation originale ne dispose pas de la polyvalence multitâche native que l'on trouve dans le cadre Ultralytics , se concentrant principalement sur la détection. En outre, l'entraînement de ces architectures peut être plus gourmand en ressources que les pipelines hautement optimisés de YOLO11.

En savoir plus sur YOLOv9

Mesures de performance : Vitesse et précision

Lors de la sélection d'un modèle, il est essentiel de comprendre le compromis entre la vitesse d'inférence et la précision de détection. Le tableau ci-dessous compare les performances des deux familles de modèles sur l'ensemble de données COCO .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Analyse

Les données mettent en évidence l'équilibre des performances intégré dans YOLO11.

  • Efficacité : YOLO11n dépasse YOLOv9t en termes de précision (39,5 % contre 38,3 %) tout en consommant moins de FLOP (6,5 milliards contre 7,7 milliards), ce qui en fait un outil de choix pour les déploiements mobiles.
  • Vitesse : Dans l'ensemble, YOLO11 démontre des temps d'inférence plus rapides sur les GPU T4 utilisant TensorRT, un facteur critique pour l'analyse vidéo en temps réel.
  • Précision : Si YOLOv9 occupe la première place pour la mAP brute, c'est au prix d'une latence nettement plus élevée (16,77 ms contre 11,3 ms pour YOLO11x). Pour la plupart des applications pratiques, l'avantage en termes de vitesse de YOLO11 l'emporte sur le gain marginal en mAP.

Facilité d'utilisation et écosystème

La différence en termes de "soft skills" - facilité d'utilisation, documentation et assistance - est le point sur lequel les modèles Ultralytics se distinguent vraiment.

Facilité d'utilisation et efficacité de la formation

YOLO11 est conçu pour être accessible. Avec un logiciel standard Python vous pouvez entraîner, valider et déployer des modèles en quelques lignes de code. Ultralytics fournit des poids pré-entraînés qui permettent l'apprentissage par transfert, ce qui réduit considérablement le temps d'entraînement et l'empreinte carbone du développement de l'IA.

En revanche, bien que YOLOv9 soit disponible dans le package Ultralytics , sa base de code de recherche originale nécessite une compréhension plus approfondie des configurations d'apprentissage profond. Les utilisateurs de YOLO11 bénéficient d'une interface unifiée qui fonctionne de manière identique, qu'il s'agisse de segmentation ou de classification.

Comparaison des codes : Simplicité de YOLO11

L'apprentissage d'un modèle YOLO11 est simple grâce à l'APIPython d'Ultralytics .

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

Un écosystème bien entretenu

Choisir YOLO11 , c'est entrer dans un environnement soutenu. L'écosystèmeUltralytics comprend

Cas d'utilisation idéaux

Quand choisir YOLO11

YOLO11 est le choix recommandé pour 95% des projets commerciaux et amateurs en raison de sa polyvalence et de sa rapidité.

  • Edge AI : déploiement sur des appareils tels que Raspberry Pi ou NVIDIA Jetson où la mémoire et les FLOP sont limités.
  • Surveillance en temps réel : Applications nécessitant un taux d'images par seconde élevé pour la surveillance de la sécurité.
  • Applications multitâches : Projets nécessitant une détection, une segmentation et une estimation de la pose simultanées sans avoir à gérer plusieurs architectures de modèles distinctes.

Quand choisir YOLOv9

YOLOv9 est mieux adapté à des scénarios académiques spécifiques ou de haute précision.

  • L'étalonnage de la recherche : Lorsque l'objectif principal est de comparer des architectures théoriques ou de battre un score mAP spécifique sur un ensemble de données comme COCO.
  • Traitement hors ligne : Scénarios où la vitesse d'inférence n'est pas une contrainte et où chaque fraction de pourcentage de précision compte, comme l'analyse d'imagerie médicale hors ligne.

Conclusion

Tout en YOLOv9 introduit des concepts fascinants tels que PGI et GELAN dans la communauté universitaire, Ultralytics YOLO11 s'impose comme le meilleur choix pratique pour la création de produits d'IA. Sa combinaison inégalée de vitesse, de précision, de polyvalence et de facilité d'utilisation en fait le modèle de référence pour la vision par ordinateur moderne. Soutenu par un écosystème solide et conçu pour l'efficacité, YOLO11 permet aux développeurs de passer du concept au déploiement en toute confiance.

Explorer d'autres modèles

Si vous êtes intéressé par d'autres comparaisons, n'hésitez pas à explorer ces autres modèles de haute performance dans la bibliothèque Ultralytics :

  • YOLOv10: détection d'objets en temps réel et de bout en bout.
  • YOLOv8: Le prédécesseur de YOLO11, encore largement utilisé en production.
  • RT-DETR: un détecteur basé sur un transformateur offrant une grande précision pour les environnements GPU.

Commentaires