Passer au contenu

Ultralytics YOLOv10 YOLOv5: évolution de la détection d'objets en temps réel

Le choix du modèle de détection d'objets approprié implique de trouver un équilibre entre l'efficacité architecturale, les contraintes de déploiement et le soutien de la communauté. Cette comparaison exhaustive explore les différences techniques entre YOLOv10, une avancée académique majeure dans le domaine de la détection de bout en bout, et YOLOv5, la norme industrielle légendaire qui a redéfini la facilité d'utilisation dans le domaine de la vision par ordinateur.

Ces deux modèles représentent des avancées significatives dans la YOLO . Alors que YOLOv5 la norme en matière d'expérience utilisateur et de fiabilité, YOLOv10 les limites de la latence en supprimant la suppression non maximale (NMS) du pipeline d'inférence. Pour les développeurs à la recherche de la toute dernière technologie en matière de vitesse et d'architecture de bout en bout, le tout nouveau Ultralytics s'appuie sur ces fondements et offre une optimisation supérieure pour les appareils périphériques.

Comparaison des métriques de performance

Le tableau ci-dessous met en évidence les compromis en termes de performances entre les deux architectures. YOLOv10 offre YOLOv10 une plus grande précision (mAP) et élimine NMS , tandis que YOLOv5 un choix très compétitif en raison de sa grande compatibilité de déploiement et de sa maturité.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv10 : L'innovateur de bout en bout

YOLOv10 un changement de paradigme en éliminant le besoin de suppression non maximale (NMS) pendant le post-traitement. Cela permet un déploiement véritablement de bout en bout, réduisant ainsi la latence et la complexité de l'inférence.

Principales caractéristiques architecturales

  • FormationNMS: utilise des attributions doubles cohérentes pour la formation NMS, permettant au modèle de prédire directement des cadres de sélection distincts.
  • Conception holistique efficace : optimise divers composants (tels que la colonne vertébrale et le cou) afin de réduire la redondance informatique.
  • Sous-échantillonnage découplé spatial-canal : améliore la conservation des informations lors de la réduction de la carte des caractéristiques.
  • Conception de blocs guidée par classement : adapte les étapes des blocs afin de réduire la redondance sur la base d'une analyse intrinsèque du classement.

Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation :Université Tsinghua
Date : 23 mai 2024
Liens :Arxiv | GitHub

Latence de bout en bout

En supprimant NMS, YOLOv10 réduit YOLOv10 les variations d'inférence. Dans YOLO standard, NMS est proportionnel au nombre d'objets détectés, ce qui peut entraîner des pics de latence dans les scènes encombrées. Le temps de sortie constant YOLOv10 le rend idéal pour les systèmes en temps réel avec des contraintes de temps strictes.

En savoir plus sur YOLOv10

YOLOv5: la norme industrielle

Lancé par Ultralytics 2020, YOLOv5 le domaine non seulement par son architecture, mais aussi par son accessibilité. Il a donné la priorité à une expérience « prête à l'emploi » fluide, à une exportabilité robuste et à un écosystème de support massif.

Principaux atouts

  • Écosystème mature : une documentation complète, des tutoriels et le soutien de la communauté facilitent le dépannage.
  • Large compatibilité : la prise en charge de l'exportation vers TFLite, CoreML, ONNX et TensorRT le déploiement sur pratiquement tous les matériels, des iOS aux TPU de pointe.
  • Polyvalence : prise en charge native de la segmentation d'instances et de la classification d'images, en plus de la détection.
  • Stabilité de l'entraînement : réputé pour sa robustesse face aux variations d'hyperparamètres et sa convergence fiable sur divers ensembles de données personnalisés.

Auteur : Glenn Jocher
Organisation :Ultralytics
Date : 26/06/2020
Liens :GitHub | Docs

En savoir plus sur YOLOv5

Comparaison Détaillée

Architecture et entraînement

YOLOv10 des optimisations de type Transformer et une distinction avancée par canal pour atteindre une grande précision avec moins de paramètres. Sa stratégie de « double attribution cohérente » lui permet d'apprendre la correspondance un-à-un pendant l'entraînement, supprimant ainsi NMS .

YOLOv5 une structure classique CSPDarknet avec un cou PANet, optimisée pour offrir un équilibre entre vitesse et précision. Il utilise la détection basée sur des ancres, qui nécessite un réglage minutieux des boîtes d'ancrage pour obtenir des performances optimales sur des ensembles de données uniques, bien que sa fonction d'évolution automatique des ancres gère cela automatiquement pour la plupart des utilisateurs.

Cas d'utilisation et applications réelles

Scénarios idéaux pour YOLOv10:

  • Foules très denses : là où NMS ralentit NMS le traitement en raison du nombre important de boîtes qui se chevauchent.
  • Robotique à faible latence : lorsque le temps d'inférence constant est essentiel pour les boucles de contrôle.
  • Recherche universitaire : pour étudier les mécanismes de détection de bout en bout et les stratégies d'attribution d'étiquettes.

Scénarios idéaux pour YOLOv5:

  • Déploiement mobile : pipelines éprouvés pour iOS Android iOS utilisant TFLite CoreML.
  • Inspection industrielle : où la stabilité à long terme et la reproductibilité sont plus importantes que les dernières avancées technologiques en matière de mAP.
  • Projets pour débutants : le point d'entrée le plus facile pour les étudiants qui apprennent la vision par ordinateur.

Facilité d'utilisation et écosystème

YOLOv5 par son intégration dans Ultralytics . Les utilisateurs peuvent visualiser les cycles d'entraînement avec Comet , track et déployer des modèles en toute transparence. La Ultralytics simplifie encore davantage ce processus en proposant une interface sans code pour la gestion des ensembles de données et l'entraînement des modèles.

Bien que YOLOv10 intégré auPython Ultralytics , ce qui permet d'utiliser une syntaxe familière, il s'agit avant tout d'une contribution académique. Par conséquent, il se peut qu'il ne bénéficie pas de la même fréquence de mises à jour ou du même niveau de maintenance que Ultralytics de base tels que YOLO11 ou le très performant YOLO26.

Exemples de code

Les deux modèles partagent Ultralytics unifiée, ce qui permet de passer facilement de l'un à l'autre pour effectuer des tests de performance.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")

# Train YOLOv10 on a custom dataset
model_v10.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a pretrained YOLOv5 model (via the v8/v11/26 compatible loader)
model_v5 = YOLO("yolov5nu.pt")

# Train YOLOv5 using the modern Ultralytics engine
model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)

Conclusion : Lequel choisir ?

Si votre priorité est une précision de pointe et une latence constante, en particulier dans les scènes encombrées, YOLOv10 est un excellent choix. Ses innovations architecturales donnent un aperçu de l'avenir de la détection NMS.

Cependant, si vous avez besoin d'une solution éprouvée, accompagnée de guides de déploiement complets, d'une large prise en charge matérielle et d'une stabilité maximale, YOLOv5 reste une solution très performante.

Pour les développeurs qui souhaitent bénéficier du meilleur des deux mondes (inférence de bout en bout NMS, précision supérieure et soutien total de Ultralytics ), nous recommandons vivement d'explorer YOLO26. YOLO26 intègre la conception NMS mise au point par YOLOv10 l'améliore grâce à l'optimiseur MuSGD et à des fonctions de perte optimisées pour CPU jusqu'à 43 % plus rapide.

Découvrir plus de modèles

  • YOLO11: La génération SOTA précédente, offrant une excellente polyvalence pour toutes les tâches.
  • RT-DETR: Détecteur en temps réel basé sur un transformateur qui supprime également NMS.
  • YOLO26: le modèle le plus récent et le plus avancé Ultralytics, doté d'un traitement de bout en bout et d'une optimisation de pointe.

Commentaires