YOLOv10 vs YOLOv7 : Comparaison détaillée
Le choix du bon modèle de détection d'objets est essentiel pour les projets de vision par ordinateur. Ultralytics YOLO offre une gamme de modèles adaptés à différents besoins. Cette page fournit une comparaison technique entre YOLOv10 et YOLOv7, deux choix populaires pour les tâches de détection d'objets. Nous analyserons leurs architectures, leurs performances et leurs applications idéales afin de vous aider à prendre une décision éclairée.
Modèle | taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
YOLOv10, présenté en mai 2024 par des chercheurs de l'université de Tsinghua, est à la pointe de la détection d'objets en temps réel. Dans leur article Arxiv intitulé"YOLOv10 : Real-Time End-to-End Object Detection", Ao Wang, Hui Chen, Lihao Liu et al. présentent YOLOv10 comme une avancée significative axée à la fois sur l'efficacité et la précision. L'implémentation officielle est disponible sur GitHub. YOLOv10 est conçu pour un déploiement de bout en bout, ce qui permet de remédier à la dépendance des versions précédentes de YOLO à l'égard de la suppression non maximale (NMS).
Architecture et caractéristiques principales :
YOLOv10 présente plusieurs innovations architecturales visant à améliorer la vitesse et à réduire la redondance des calculs. Les principales caractéristiques comprennent une approche sans ancrage et une conception sans NMS, rationalisant le post-traitement et accélérant l'inférence. Le modèle adopte une stratégie de conception holistique axée sur l'efficacité et la précision, optimisant divers composants pour une surcharge minimale et une capacité maximale. Il en résulte un modèle qui est non seulement plus rapide, mais qui conserve également une précision compétitive, ce qui le rend adapté aux dispositifs de pointe et aux applications en temps réel.
Indicateurs de performance et repères :
Comme le montre le tableau de comparaison, les modèles YOLOv10, en particulier les variantes YOLOv10n et YOLOv10s, offrent des vitesses d'inférence impressionnantes sur TensorRT, atteignant respectivement 1,56 ms et 2,66 ms. YOLOv10n atteint une mAPval50-95 de 39,5 avec seulement 2,3M de paramètres et 6,7B FLOPs, tandis que YOLOv10x atteint 54,4 mAPval50-95. Ces mesures soulignent la capacité de YOLOv10 à fournir des performances de pointe avec des ressources de calcul optimisées. Pour une compréhension plus approfondie des mesures de performance de YOLO , consultez la documentation d'Ultralytics sur les mesures de performance deYOLO .
Cas d'utilisation :
L'accent mis par YOLOv10 sur les performances et l'efficacité en temps réel en fait un outil idéal pour les applications nécessitant une détection rapide d'objets avec des ressources informatiques limitées. Les cas d'utilisation appropriés sont les suivants :
- Applications d'IA en périphérie : Déploiement sur des appareils périphériques pour le traitement en temps réel dans des scénarios tels que les caméras intelligentes et les appareils IoT.
- Robotique : Permettre une reconnaissance plus rapide et plus efficace des objets pour la navigation et l'interaction dans les systèmes robotiques, comme indiqué dans le chapitre sur le rôle de l'IA dans la robotique.
- Systèmes autonomes : Applications dans les véhicules autonomes et les drones où une faible latence est cruciale pour un fonctionnement sûr et efficace.
- Systèmes mobiles et embarqués : Détection d'objets dans les applications mobiles et les systèmes embarqués avec une puissance de calcul limitée.
Points forts :
- Haute efficacité : Conception sans NMS et architecture optimisée pour une inférence plus rapide et une latence réduite.
- Précision compétitive : Maintient une grande précision tout en améliorant considérablement la vitesse.
- Déploiement de bout en bout : Conçu pour une détection d'objets en temps réel, transparente et de bout en bout.
- Des modèles plus petits : Une architecture efficace permet de réduire la taille des modèles et le nombre de paramètres par rapport à certains prédécesseurs.
Faiblesses :
- Relativement nouveau : En tant que modèle plus récent, YOLOv10 peut avoir une communauté plus petite et moins d'exemples de déploiement par rapport à des modèles plus établis comme YOLOv7.
- Optimisation des performances : Pour obtenir des performances optimales, il peut être nécessaire de procéder à un réglage fin et d'expérimenter différentes tailles et configurations de modèles, comme indiqué dans les conseils relatifs à l'apprentissage des modèles.
YOLOv7
YOLOv7, présenté en juillet 2022 par Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao, est un modèle de détection d'objets très réputé pour son efficacité et sa précision. Le modèle est décrit en détail dans l'article Arxiv intitulé"YOLOv7 : Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors", et le dépôt officiel GitHub fournit des détails sur sa mise en œuvre. YOLOv7 s'appuie sur les versions précédentes de YOLO et intègre des améliorations architecturales visant à maximiser les performances sans augmenter de manière substantielle les coûts de calcul.
Architecture et caractéristiques principales :
YOLOv7 intègre plusieurs innovations architecturales pour améliorer ses performances et son efficacité. Ses principales caractéristiques sont les suivantes :
- Réseaux d'agrégation de couches efficaces étendus (E-ELAN) : Améliore les capacités d'apprentissage du réseau et le flux de gradient.
- Mise à l'échelle des modèles basés sur la concaténation : Fournit des lignes directrices pour une mise à l'échelle efficace de la profondeur et de la largeur.
- Tête auxiliaire et tête de lecture grossière à fine : améliore l'efficacité de la formation et la précision de la détection.
Ces caractéristiques contribuent à la capacité de YOLOv7 à obtenir des résultats de pointe en termes de vitesse et de précision, ce qui en fait un choix solide pour diverses tâches de détection d'objets.
Indicateurs de performance et repères :
YOLOv7 démontre un bon équilibre entre vitesse et précision. Comme le montre le tableau, YOLOv7l atteint une mAPval50-95 de 51,4, tandis que YOLOv7x atteint 53,1 mAPval50-95. Bien que légèrement plus lents que YOLOv10n et YOLOv10s en termes de vitesse d'inférence TensorRT , les modèles YOLOv7 offrent toujours des performances compétitives, en particulier si l'on considère les modèles YOLOv7 de plus grande taille. Pour des mesures détaillées, veuillez vous référer à la documentation de YOLOv7.
Cas d'utilisation :
L'équilibre entre la précision et l'efficacité de YOLOv7 le rend adapté aux applications nécessitant une détection fiable des objets dans des scénarios en temps réel. Les cas d'utilisation idéaux sont les suivants
- Véhicules autonomes : Détection robuste d'objets dans des environnements de conduite complexes, essentielle pour l'IA dans les voitures autonomes.
- Systèmes de surveillance avancés : Haute précision pour l'identification des menaces potentielles dans les systèmes de sécurité.
- Robotique : Reconnaissance précise d'objets pour la manipulation et la navigation en robotique, similaire à YOLOv10, mais favorisant potentiellement la précision dans certains scénarios.
- Automatisation industrielle : Contrôle de la qualité et détection des défauts dans les processus de fabrication où la précision est primordiale.
Points forts :
- Précision moyenne élevée : Précision moyenne élevée, ce qui indique une excellente précision de détection des objets.
- Inférence efficace : Conçue pour une inférence rapide, adaptée aux applications en temps réel.
- Bien établi et mature : YOLOv7 bénéficie d'une communauté plus large et d'une utilisation étendue, ce qui permet de disposer de plus de ressources et de soutien.
- Taille des modèles gérable : Offre un bon équilibre entre la taille du modèle et la performance.
Faiblesses :
- Complexité : L'architecture est plus complexe que certains modèles plus simples, ce qui peut nécessiter une plus grande expertise pour la mise au point et l'optimisation.
- Intensité des ressources par rapport aux nanomodèles : Bien qu'efficace, ce modèle est plus gourmand en ressources informatiques que les modèles plus petits comme YOLOv10n, en particulier dans les environnements où les ressources sont extrêmement limitées.
Autres modèles YOLO
Outre YOLOv10 et YOLOv7, Ultralytics propose une gamme de modèles YOLO , chacun présentant des atouts uniques. Envisagez d'explorer YOLOv8 pour une option polyvalente et conviviale, YOLOv9 pour les avancées en matière d'architecture de réseau, et YOLO11 pour les performances les plus récentes. Vous pouvez également comparer YOLOv7 avec d'autres modèles tels que YOLOv5 et YOLOX pour comprendre leurs avantages spécifiques.