Passer au contenu

YOLOv10 vs YOLOv7 : Une comparaison technique détaillée

Choisir le bon modèle de détection d'objets est crucial pour les projets de vision par ordinateur, car cela a un impact sur les performances, la vitesse et l'utilisation des ressources. Cette page fournit une comparaison technique entre YOLOv10 et YOLOv7, deux modèles importants de la famille You Only Look Once (YOLO), afin de vous aider à choisir celui qui convient le mieux à vos besoins. Nous examinerons en détail leurs architectures, leurs mesures de performance et leurs cas d'utilisation idéaux.

YOLOv10

YOLOv10, introduit en mai 2024 par des chercheurs de l'Université de Tsinghua, représente une avancée significative dans la détection d'objets en temps réel. Son innovation principale est de réaliser une détection d'objets de bout en bout en éliminant le besoin de Suppression Non Maximale (NMS) pendant l'inférence. Cette percée réduit la surcharge de calcul et diminue la latence d'inférence, rendant le déploiement plus efficace.

Détails techniques :

Architecture et principales fonctionnalités

YOLOv10 introduit plusieurs innovations architecturales visant à optimiser le compromis vitesse-précision :

  • Formation sans NMS : En utilisant des affectations doubles cohérentes pour l’affectation des étiquettes, YOLOv10 évite les prédictions redondantes et élimine le besoin de l’étape de post-traitement NMS. Cela simplifie le pipeline de déploiement et rend le modèle véritablement de bout en bout.
  • Conception holistique axée sur l’efficacité et la précision : L’architecture du modèle a été optimisée de manière holistique à la fois pour l’efficacité et la performance. Cela comprend l’introduction d’une tête de classification légère et l’utilisation d’un sous-échantillonnage spatial-canal découplé pour réduire la redondance de calcul tout en améliorant la capacité du modèle.
  • Approche sans ancres : Comme d’autres modèles YOLO modernes, il adopte une conception de détecteur sans ancres, ce qui simplifie la tête de détection et améliore la généralisation.
  • Intégration transparente à Ultralytics : YOLOv10 est entièrement intégré à l’écosystème Ultralytics, bénéficiant d’une expérience utilisateur simplifiée avec une API Python simple et de puissantes commandes CLI. Cela rend la formation, la validation et le déploiement exceptionnellement simples.

Points forts

  • Efficacité à la pointe de la technologie : La conception sans NMS et les optimisations architecturales conduisent à des vitesses d'inférence plus rapides et à une latence considérablement plus faible, ce qui est essentiel pour les applications en temps réel.
  • Précision compétitive : YOLOv10 maintient une précision élevée tout en réduisant considérablement la taille du modèle et le coût de calcul par rapport à ses prédécesseurs.
  • Déploiement simplifié : La suppression de NMS crée un véritable pipeline de détection de bout en bout, ce qui facilite le déploiement, en particulier sur les appareils périphériques.
  • Excellente évolutivité : Offre une gamme de modèles allant de Nano (N) à Extra-large (X), répondant à divers besoins de performance, du matériel périphérique aux ressources limitées aux puissants serveurs cloud.

Faiblesses

  • Nouveau modèle : En tant que version récente, le soutien de la communauté et le nombre d'intégrations de tiers peuvent être moins importants que pour les modèles plus établis comme YOLOv7 ou Ultralytics YOLOv8.

En savoir plus sur YOLOv10

YOLOv7

YOLOv7, publié en juillet 2022, a rapidement établi une nouvelle norme pour la détection d'objets grâce à son équilibre remarquable entre vitesse et précision. Développé par des chercheurs de l'Institute of Information Science, Academia Sinica, il a introduit plusieurs améliorations architecturales et stratégies d'entraînement connues sous le nom de "trainable bag-of-freebies" pour améliorer les performances sans augmenter les coûts d'inférence.

Détails techniques :

Architecture et principales fonctionnalités

L’architecture de YOLOv7 intègre plusieurs améliorations clés qui ont repoussé les limites de la détection d’objets en temps réel au moment de sa sortie :

  • Extended Efficient Layer Aggregation Networks (E-ELAN) : Cette structure de réseau avancée améliore la capacité du modèle à apprendre diverses caractéristiques tout en maintenant un flux de gradient efficace, ce qui conduit à une meilleure précision et à une convergence plus rapide.
  • Mise à l’échelle du modèle pour les modèles basés sur la concaténation : YOLOv7 a introduit des méthodes de mise à l’échelle composées qui ajustent intelligemment la profondeur et la largeur du modèle afin d’optimiser les performances en fonction des différents budgets de calcul.
  • Sac de cadeaux entraînable : Il exploite des techniques d'entraînement avancées, telles que l'utilisation d'une tête auxiliaire avec un guidage grossier à fin, pour améliorer la précision sans ajouter de surcharge pendant l'inférence.

Points forts

  • mAP élevé : Offre une excellente précision de détection d'objets, ce qui en fait un choix judicieux pour les applications où la précision est primordiale.
  • Inférence rapide : Offre des vitesses d'inférence compétitives qui conviennent à de nombreuses tâches en temps réel, en particulier sur du matériel GPU.
  • Bien établi : Disponible depuis plus longtemps, YOLOv7 bénéficie d'une base communautaire plus large, de plus de tutoriels et d'une adoption plus large dans divers projets.

Faiblesses

  • Dépendance NMS : Contrairement à YOLOv10, YOLOv7 repose sur l'étape de post-traitement NMS, ce qui augmente la latence d'inférence globale et complique le pipeline de déploiement.
  • Moins efficace : Comparativement à YOLOv10, les modèles YOLOv7 ont généralement plus de paramètres et des FLOPs plus élevés pour un niveau de précision similaire, ce qui les rend moins efficaces.

En savoir plus sur YOLOv7

Comparaison des performances : YOLOv10 vs YOLOv7

Lorsqu'on compare les performances, YOLOv10 démontre un avantage clair en termes d'efficacité. La comparaison la plus directe est entre YOLOv10-M et YOLOv7-L. Comme le montre le tableau ci-dessous, YOLOv10-M atteint un mAPval presque identique de 51,3 % par rapport aux 51,4 % de YOLOv7-L. Cependant, YOLOv10-M est nettement plus efficace : il est plus rapide (5,48 ms contre 6,84 ms sur TensorRT), a moins de la moitié des paramètres (15,4 M contre 36,9 M) et nécessite beaucoup moins de ressources de calcul (59,1 B FLOPs contre 104,7 B FLOPs). Cela met en évidence la conception architecturale supérieure de YOLOv10, qui offre une précision comparable avec une efficacité beaucoup plus grande.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Conclusion

YOLOv10 et YOLOv7 sont tous deux des modèles de détection d'objets puissants, mais YOLOv10 représente la prochaine étape en matière d'efficacité de la détection en temps réel. Son architecture sans NMS fournit une véritable solution de bout en bout qui est plus rapide, plus légère et plus facile à déployer sans sacrifier la précision. Pour les nouveaux projets, en particulier ceux ciblant l'IA en périphérie ou nécessitant une latence minimale, YOLOv10 est le choix recommandé.

Bien que YOLOv7 soit toujours un modèle performant, sa dépendance à NMS et son architecture moins efficace en font un meilleur choix pour les projets existants ou les scénarios où ses vastes ressources communautaires sont une considération primordiale. Pour les développeurs à la recherche des meilleures performances, de la facilité d'utilisation et d'un écosystème complet, les modèles Ultralytics comme YOLOv10 offrent une expérience supérieure. L'intégration avec Ultralytics HUB simplifie davantage la formation et le déploiement, rendant la vision par ordinateur avancée plus accessible que jamais.

Explorer d'autres modèles

Pour une exploration plus approfondie, consultez ces autres modèles de pointe disponibles dans la documentation Ultralytics :

  • Ultralytics YOLOv8 : Un modèle très polyvalent qui excelle dans de multiples tâches de vision, notamment la détection, la segmentation et l'estimation de pose.
  • YOLOv9 : Introduit des innovations comme Programmable Gradient Information (PGI) pour remédier à la perte d'informations dans les réseaux profonds.
  • YOLO11 : Le dernier modèle officiel d'Ultralytics, offrant des performances de pointe, une prise en charge multitâche et une facilité d'utilisation inégalée.


📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires