YOLO11 vs YOLOv9 : Une comparaison technique pour la détection d'objets
Ultralytics fournit constamment des modèles YOLO de pointe, repoussant les limites de la détection d'objets en temps réel. Cette page fournit une comparaison technique entre deux modèles avancés : Ultralytics YOLO11 et YOLOv9. Nous analysons leurs innovations architecturales, leurs performances et leurs applications appropriées afin de vous guider dans la sélection du modèle optimal pour vos tâches de vision par ordinateur.
Ultralytics YOLO11 : La pointe de la technologie
Ultralytics YOLO11, la plus récente itération de la série Ultralytics YOLO, s'appuie sur les succès précédents tels que YOLOv8. YOLO11 est conçu pour une précision et une efficacité accrues dans diverses tâches de vision par ordinateur, notamment la détection d'objets, la segmentation d'instance, la classification d'images et l'estimation de pose.
Détails techniques :
- Auteurs : Glenn Jocher, Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : https://github.com/ultralytics/ultralytics
- Docs : https://docs.ultralytics.com/models/yolo11/
Architecture et principales fonctionnalités
YOLO11 dispose d'une architecture conçue pour améliorer l'extraction des caractéristiques et accélérer le traitement. Il atteint une plus grande précision, souvent avec moins de paramètres que ses prédécesseurs, ce qui améliore les performances en temps réel et permet un déploiement sur diverses plateformes, des appareils périphériques tels que NVIDIA Jetson et Raspberry Pi à l'infrastructure cloud. Un avantage clé de YOLO11 est son intégration transparente dans l'écosystème Ultralytics bien maintenu, offrant une expérience utilisateur simplifiée grâce à une simple API Python et une documentation exhaustive. Cet écosystème garantit un entraînement efficace avec des poids pré-entraînés facilement disponibles et bénéficie d'un développement actif, d'un solide support communautaire via GitHub et Discord, et de mises à jour fréquentes. De plus, YOLO11 fait preuve de polyvalence en prenant en charge de multiples tâches de vision au-delà de la détection, une caractéristique souvent absente des modèles concurrents. Il nécessite également généralement moins de mémoire pendant l'entraînement et l'inférence par rapport à d'autres types de modèles comme les transformateurs.
Points forts
- Équilibre des performances : Excellent compromis entre vitesse et précision.
- Facilité d'utilisation : API simple, documentation complète et écosystème intégré (Ultralytics HUB).
- Polyvalence : Prend en charge les tâches de détection, de segmentation, de classification, de pose et d’OBB.
- Efficacité : Optimisé pour divers matériels, entraînement efficace et faible encombrement mémoire.
- Bien maintenu : Activement développé, fort soutien communautaire et mises à jour fréquentes.
Faiblesses
- En tant que détecteur à une étape, peut rencontrer des difficultés avec les objets extrêmement petits par rapport à certains détecteurs à deux étapes.
- Les modèles plus grands nécessitent plus de ressources de calcul, bien que généralement moins que les modèles basés sur des transformateurs.
Cas d'utilisation idéaux
YOLO11 est idéal pour les applications exigeant une haute précision et un traitement en temps réel :
- Villes intelligentes : Pour la gestion du trafic et les systèmes de sécurité.
- Santé : Dans l’analyse d’images médicales pour l’aide au diagnostic.
- Fabrication : Pour le contrôle de la qualité dans les chaînes de production automatisées.
- Agriculture : Dans la surveillance de la santé des cultures pour l’agriculture de précision.
YOLOv9 : Amélioration de la précision avec de nouveaux concepts
YOLOv9, introduit au début de 2024, représente une contribution académique significative à la détection d'objets, en se concentrant sur la résolution de la perte d'informations dans les réseaux neuronaux profonds.
Détails techniques :
- Auteurs : Chien-Yao Wang, Hong-Yuan Mark Liao
- Organisation : Institute of Information Science, Academia Sinica, Taiwan
- Date : 2024-02-21
- Arxiv : https://arxiv.org/abs/2402.13616
- GitHub : https://github.com/WongKinYiu/yolov9
- Documentation : https://docs.ultralytics.com/models/yolov9/
Architecture et principales fonctionnalités
YOLOv9 introduit deux innovations architecturales majeures : l’information de gradient programmable (PGI) et le réseau d’agrégation de couches efficace généralisé (GELAN). La PGI est conçue pour fournir des informations d’entrée complètes pour le calcul de la fonction de perte, atténuant ainsi le problème de goulot d’étranglement de l’information qui peut dégrader les performances dans les réseaux profonds. GELAN est une nouvelle architecture de réseau très efficace qui optimise l’utilisation des paramètres et l’efficacité du calcul. Ensemble, ces caractéristiques permettent à YOLOv9 d’établir de nouvelles références en matière de précision sur l’ensemble de données COCO.
Points forts
- Précision améliorée : Établit de nouveaux résultats de pointe sur l’ensemble de données COCO pour les détecteurs d’objets en temps réel, surpassant de nombreux modèles précédents en mAP.
- Amélioration de l'efficacité : GELAN et PGI contribuent à des modèles qui nécessitent moins de paramètres et de ressources de calcul (FLOPs) pour des performances comparables ou meilleures.
- Préservation de l'information : PGI s'attaque efficacement au problème du goulot d'étranglement de l'information, qui est crucial pour la formation précise de réseaux plus profonds et plus complexes.
Faiblesses
- Ressources d'entraînement : L'entraînement des modèles YOLOv9 peut nécessiter plus de ressources et de temps que Ultralytics YOLOv5, comme indiqué dans la documentation YOLOv9.
- Architecture plus récente : Étant un modèle plus récent provenant d'un groupe de recherche différent, son écosystème, le soutien de la communauté et les intégrations de tiers sont moins matures que l'écosystème Ultralytics bien établi.
- Polyvalence des tâches : Principalement axé sur la détection d'objets, sans la prise en charge intégrée de la segmentation, de la classification et de l'estimation de la pose que l'on trouve dans les modèles Ultralytics tels que YOLO11 et YOLOv8.
Cas d'utilisation idéaux
YOLOv9 est bien adapté aux applications où l’obtention de la plus grande précision possible de détection d’objets est l’objectif principal :
- Analyse vidéo avancée : Suivi et analyse de haute précision dans des scènes complexes.
- Inspection industrielle de haute précision : Détection de défauts minimes dans la fabrication.
- Recherche et évaluation comparative : Repousser les limites de la précision de la détection sur des ensembles de données standard.
Comparaison directe des performances : YOLO11 contre YOLOv9
YOLO11 et YOLOv9 offrent tous deux une gamme de tailles de modèles, permettant aux développeurs de trouver le juste équilibre entre vitesse et précision pour leurs besoins spécifiques. Le tableau suivant fournit une comparaison directe de leurs mesures de performance sur l'ensemble de données COCO.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
D'après les données, nous pouvons constater que les modèles YOLO11 offrent un équilibre exceptionnel en termes de performances. Par exemple, YOLO11s atteint un mAP plus élevé que YOLOv9s avec moins de FLOPs. De même, YOLO11l surpasse YOLOv9c en précision tout en ayant des FLOPs nettement inférieurs et une vitesse d'inférence GPU plus rapide. Bien que le plus grand modèle YOLOv9-E atteigne le mAP le plus élevé, YOLO11 offre un compromis plus pratique sur toute sa gamme de modèles, en particulier si l'on considère les benchmarks de vitesse complets et la facilité de déploiement fournis par le framework Ultralytics.
Différences architecturales et d'écosystème
La différence fondamentale réside dans leur philosophie de conception. Ultralytics YOLO11 est conçu pour les praticiens. Son architecture est optimisée non seulement pour la performance, mais aussi pour la convivialité, la polyvalence et l'intégration. Le framework unifié prend en charge plusieurs tâches prêtes à l'emploi, ce qui réduit considérablement le temps de développement des systèmes d'IA complexes. L'écosystème environnant, y compris Ultralytics HUB, une documentation complète et une communauté active, en fait le choix idéal pour la création et le déploiement d'applications prêtes à la production.
YOLOv9, d'autre part, est un modèle axé sur la recherche qui introduit des concepts académiques révolutionnaires. Sa force réside dans son approche novatrice pour résoudre les défis de l'apprentissage profond comme la perte d'informations. Bien que puissant, cet accent signifie qu'il lui manque l'écosystème holistique et convivial pour les développeurs qui définit les modèles Ultralytics. L'intégration de YOLOv9 dans un pipeline multi-tâches ou son déploiement sur divers matériels peut nécessiter plus d'efforts manuels et d'expertise.
Conclusion : Quel modèle devriez-vous choisir ?
Pour la grande majorité des développeurs, des chercheurs et des entreprises, Ultralytics YOLO11 est le choix recommandé. Il offre une combinaison supérieure de haute performance, de vitesse, de polyvalence et de facilité d'utilisation inégalée. L'écosystème robuste et la maintenance active vous permettent de passer rapidement et efficacement du concept à la production. Sa capacité à gérer la détection, la segmentation, la classification et plus encore dans un cadre unique en fait une solution puissante et à l'épreuve du temps.
YOLOv9 est un excellent modèle pour les spécialistes et les chercheurs dont l'objectif principal est d'atteindre la précision de détection maximale absolue sur les benchmarks, et qui sont prêts à gérer les complexités supplémentaires de l'entraînement et du déploiement en dehors d'un écosystème intégré.
Explorer d'autres modèles
Le monde de la détection d'objets est en constante évolution. Outre YOLO11 et YOLOv9, vous pourriez également être intéressé par d'autres modèles puissants disponibles dans l'écosystème Ultralytics. Consultez nos comparaisons de YOLOv10, du prédécesseur YOLOv8 et du RT-DETR basé sur un transformateur afin de trouver la solution idéale pour votre projet.