YOLOv10 vs YOLOv8 : Une comparaison technique pour la détection d'objets
Choisir le bon modèle de détection d'objets est crucial pour le succès de tout projet de vision par ordinateur. Cette page fournit une comparaison technique détaillée entre YOLOv10 et Ultralytics YOLOv8, deux modèles à la pointe de la technologie dans le domaine. Nous analyserons leurs différences architecturales, leurs mesures de performance et leurs applications idéales pour vous aider à prendre une décision éclairée en fonction de vos besoins spécifiques en matière de vitesse, de précision et d'efficacité des ressources.
YOLOv10 : Repousser les limites de l'efficacité
Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation : Université Tsinghua
Date : 2024-05-23
Arxiv : https://arxiv.org/abs/2405.14458
GitHub : https://github.com/THU-MIG/yolov10
Docs : https://docs.ultralytics.com/models/yolov10/
YOLOv10, introduit en mai 2024, représente une étape importante vers la réalisation d'une véritable détection d'objets en temps réel et de bout en bout. Son innovation principale est de se concentrer sur l'élimination des goulots d'étranglement du post-traitement et sur l'optimisation de l'architecture du modèle pour une efficacité maximale. Une caractéristique clé est son approche d'entraînement sans NMS, qui utilise des affectations doubles cohérentes pour supprimer le besoin de suppression non maximale (NMS), réduisant ainsi la latence d'inférence.
Architecture et principales fonctionnalités
YOLOv10 introduit une conception de modèle holistique axée sur l'efficacité et la précision. Il optimise divers composants, tels que la mise en œuvre d'une tête de classification légère et l'utilisation d'un sous-échantillonnage spatial-canal découplé, afin de réduire la redondance de calcul et d'améliorer les capacités de détection. Bien que développé par l'université de Tsinghua, YOLOv10 est basé sur le framework Ultralytics et y est intégré, ce qui le rend accessible et facile à utiliser avec l'API Ultralytics familière.
Points forts
- Efficacité améliorée : Offre des vitesses d’inférence plus rapides et des tailles de modèle plus petites dans les comparaisons directes, ce qui est très avantageux pour les environnements aux ressources limitées comme les appareils périphériques.
- Conception sans NMS : Simplifie le pipeline de déploiement en supprimant l'étape de post-traitement NMS, ce qui entraîne une latence de bout en bout plus faible.
- Performance de pointe : Atteint d’excellentes performances, en particulier dans les benchmarks axés sur la latence, repoussant les limites en matière de compromis vitesse-précision.
Faiblesses
- Nouveau modèle : En tant que version plus récente, sa communauté est plus petite et il dispose de moins d'intégrations de tiers que le YOLOv8 bien établi.
- Spécialisation de tâche : YOLOv10 est principalement axé sur la détection d’objets. Il ne possède pas la polyvalence intégrée pour d’autres tâches de vision telles que la segmentation et l’estimation de pose qui sont natives de YOLOv8.
- Maturité de l'écosystème : Bien qu'il soit intégré à l'écosystème Ultralytics, il ne possède pas encore la même profondeur de ressources et d'exemples axés sur la communauté que YOLOv8.
Cas d'utilisation idéaux
YOLOv10 est particulièrement bien adapté aux applications où les performances en temps réel et l'efficacité des ressources sont les priorités absolues :
- IA en périphérie (Edge AI) : Idéal pour le déploiement sur des appareils avec une puissance de calcul limitée, tels que les téléphones mobiles et les systèmes embarqués comme le NVIDIA Jetson.
- Traitement à haute vitesse : Convient aux applications nécessitant une très faible latence, telles que les drones autonomes et la robotique.
- Analyse en temps réel : Parfait pour les environnements dynamiques nécessitant une détection d’objets immédiate, comme la gestion du trafic.
Ultralytics YOLOv8 : Polyvalence et maturité
Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation : Ultralytics
Date : 2023-01-10
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8, lancé en janvier 2023, est un modèle mature et très polyvalent qui s’appuie sur les forces de ses prédécesseurs YOLO. Il est conçu pour la vitesse, la précision et la facilité d’utilisation dans un large éventail de tâches d’IA de vision. Cela en fait un choix puissant et fiable pour les développeurs et les chercheurs.
Architecture et principales fonctionnalités
YOLOv8 propose une approche de détection sans ancres, qui simplifie l’architecture du modèle et améliore la généralisation. Son backbone flexible et ses fonctions de perte optimisées contribuent à une plus grande précision et à une formation plus stable. La caractéristique la plus remarquable de YOLOv8 est sa prise en charge native de plusieurs tâches de vision, notamment la détection d’objets, la segmentation d’instance, la classification d’images, l’estimation de pose et les boîtes englobantes orientées (OBB).
Points forts
- Mature et bien documenté : Bénéficie d'une documentation complète, d'une grande communauté et de ressources facilement disponibles, ce qui le rend convivial et facile à implémenter via des interfaces Python et CLI simples.
- Polyvalent et multi-tâches : Prend en charge un large éventail de tâches de vision prêtes à l'emploi, offrant une flexibilité inégalée pour les projets complexes qui nécessitent plus que de la simple détection.
- Écosystème bien maintenu : S'intègre de manière transparente avec Ultralytics HUB et d'autres outils MLOps, rationalisant les flux de travail de l'entraînement au déploiement. Il est soutenu par un développement actif et des mises à jour fréquentes.
- Équilibre des performances : Fournit un excellent compromis entre la vitesse, la précision et la taille du modèle, ce qui le rend adapté à un large éventail de scénarios de déploiement réels.
- Efficacité de l'entraînement : Offre des processus d'entraînement efficaces et des poids pré-entraînés facilement disponibles, ce qui accélère les cycles de développement. Il a également des besoins en mémoire inférieurs à ceux de nombreuses autres architectures, en particulier les modèles basés sur des transformateurs.
Faiblesses
- Bien que très efficaces, les modèles plus récents comme YOLOv10 peuvent offrir des améliorations marginales dans des métriques spécifiques comme le nombre de paramètres ou la latence dans des scénarios très contraints.
Cas d'utilisation idéaux
La polyvalence et la facilité d'utilisation de YOLOv8 en font le choix idéal pour un large éventail d'applications :
- Systèmes de sécurité : Excellent pour la détection d'objets en temps réel dans les systèmes d'alarme de sécurité.
- Analyse de vente au détail : Utile dans le commerce de détail intelligent pour comprendre le comportement des clients et la gestion des stocks.
- Contrôle qualité industriel : Applicable dans le secteur de la fabrication pour l'inspection visuelle automatisée.
- Projets multi-tâches : Le choix idéal pour les projets nécessitant la détection, la segmentation et l'estimation de pose simultanément à partir d'un seul modèle efficace.
Analyse des performances : YOLOv10 vs. YOLOv8
Les métriques de performance sur le jeu de données COCO révèlent les différences clés entre les deux modèles. YOLOv10 atteint systématiquement des scores mAP plus élevés avec moins de paramètres et de FLOPs par rapport à ses homologues YOLOv8 de taille similaire. Par exemple, YOLOv10-S atteint un mAP de 46,7 % avec 7,2 millions de paramètres, tandis que YOLOv8-S atteint un mAP de 44,9 % avec 11,2 millions de paramètres. Cela met en évidence l'efficacité architecturale supérieure de YOLOv10.
Cependant, YOLOv8 maintient des vitesses d'inférence très compétitives, en particulier sur GPU. Le plus petit modèle, YOLOv8n, est légèrement plus rapide sur un GPU T4 avec TensorRT que YOLOv10n (1,47 ms contre 1,56 ms). De plus, YOLOv8 fournit une suite complète de benchmarks CPU bien établis, démontrant ses performances robustes et fiables pour les déploiements qui peuvent ne pas avoir accès au GPU.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Conclusion et recommandations
YOLOv10 et YOLOv8 sont tous deux des modèles puissants, mais ils répondent à des priorités différentes. YOLOv10 excelle en matière d'efficacité pure, offrant des performances de pointe avec une latence plus faible et moins de paramètres, ce qui en fait un excellent choix pour les applications spécialisées où la latence est critique.
Cependant, pour la grande majorité des développeurs et des chercheurs, Ultralytics YOLOv8 est le choix recommandé. Ses principaux avantages résident dans sa maturity, versatility, and robust ecosystem. La prise en charge native de YOLOv8 pour de multiples tâches (détection, segmentation, pose, classification et OBB) offre un avantage significatif pour la construction de solutions d'IA complexes et multifacettes. La documentation complète, la communauté active et l'intégration transparente avec des outils comme Ultralytics HUB créent une expérience de développement supérieure et plus rationalisée. Il offre un équilibre exceptionnel et éprouvé entre vitesse et précision qui est fiable pour le plus large éventail d'applications du monde réel.
Explorer d'autres modèles
Pour les utilisateurs intéressés par l'exploration d'autres modèles de pointe, Ultralytics fournit une suite complète comprenant le YOLOv5 de base, l'efficace YOLOv9 et le dernier YOLO11. Des comparaisons détaillées comme YOLOv9 vs. YOLOv8 et YOLOv5 vs. YOLOv8 sont également disponibles pour vous aider à sélectionner le modèle parfait pour votre projet.