Passer au contenu

YOLOv8 YOLOv5: comparaison technique complète

Le choix de l'architecture de vision par ordinateur appropriée est une étape cruciale dans la création de pipelines d'apprentissage automatique robustes. Dans cette comparaison technique détaillée, nous explorons les différences entre deux des modèles les plus populaires dans l'écosystème de l'IA visuelle : YOLOv8 et YOLOv5. Ces deux modèles ont été développés par Ultralytics ont considérablement influencé le paysage de la détection d'objets en temps réel, établissant les normes industrielles en matière de vitesse, de précision et de facilité d'utilisation.

Que vous déployiez des modèles sur des appareils périphériques ou que vous adaptiez l'inférence cloud, comprendre les changements architecturaux, les indicateurs de performance et les méthodologies de formation de ces modèles vous aidera à prendre une décision éclairée pour vos projets de vision par ordinateur.

Ultralytics YOLOv8 : La norme polyvalente

Sorti début 2023, YOLOv8 un changement architectural majeur par rapport à ses prédécesseurs. Il a été entièrement conçu pour servir de cadre unifié capable de gérer de manière native plusieurs tâches de vision, notamment la segmentation d'instances, la classification d'images et l'estimation de poses.

Architecture et méthodologies

YOLOv8 une tête de détection sans ancrage, qui simplifie le processus d'entraînement en éliminant le besoin de configurer manuellement des boîtes d'ancrage en fonction de la distribution des ensembles de données. Cela rend le modèle plus robuste lors de la généralisation à des ensembles de données personnalisés et réduit le nombre de prédictions de boîtes, accélérant ainsi la suppression non maximale (NMS).

L'architecture comprend un module C2f (Cross-Stage Partial bottleneck avec deux convolutions), qui remplace le module C3 présent dans YOLOv5. Le module C2f améliore le flux de gradient et permet au modèle d'apprendre des représentations de caractéristiques plus riches sans augmentation significative du coût de calcul. De plus, YOLOv8 une structure de tête découplée, séparant les tâches d'objectivité, de classification et de régression, ce qui s'est avéré améliorer la vitesse et la précision de convergence.

Efficacité de la mémoire

YOLO Ultralytics , y compris YOLOv8, sont optimisés pour une utilisation réduite CUDA pendant l'entraînement par rapport à de nombreuses alternatives basées sur Transformer telles que RT-DETR. Cela permet aux développeurs d'utiliser des lots plus importants sur des GPU grand public standard tels que ceux de la série NVIDIA

Points forts et faiblesses

Points forts :

  • Une polyvalence inégalée pour de multiples tâches allant au-delà de la simple détection de cadres de sélection.
  • Python simplifiée via le ultralytics package, rendant la formation et l'exportation très intuitives.
  • Précision moyenne (mAP) supérieure pour toutes les variantes de taille par rapport à YOLOv5.

Faiblesses :

  • La tête découplée et le module C2f entraînent une légère augmentation du nombre de paramètres et de FLOP pour certaines variantes par rapport à leurs YOLOv5 exacts.

En savoir plus sur YOLOv8

Ultralytics YOLOv5: le pionnier de l'agilité

Lancé en 2020, YOLOv5 YOLO le PyTorch , améliorant considérablement l'accessibilité pour les développeurs. Il est rapidement devenu la norme industrielle pour les modèles de détection d'objets rapides, fiables et faciles à déployer.

Architecture et méthodologies

YOLOv5 sur une architecture basée sur des ancres et utilise une structure CSPDarknet53 modifiée. Si les approches basées sur des ancres nécessitent un regroupement minutieux des cadres de sélection des ensembles de données afin de définir les ancres optimales avant l'entraînement, elles sont très efficaces pour des ensembles de données spécifiques et bien définis.

YOLOv5 le module C3, qui extrait efficacement les caractéristiques tout en conservant une faible empreinte paramétrique. Sa fonction de perte repose largement sur la perte d'objectivité combinée à des pertes de classification et de régression de boîte englobante afin de guider le réseau vers des prédictions précises.

Points forts et faiblesses

Points forts :

  • Extrêmement légères, les variantes Nano (YOLOv5n) et Small (YOLOv5s) sont parfaitement adaptées aux déploiements d'IA en périphérie avec des ressources limitées.
  • Vitesses d'inférence exceptionnellement rapides, en particulier sur les processeurs.
  • Un écosystème solidement établi, avec une vaste communauté de tutoriels et d'intégrations tierces.

Faiblesses :

  • Nécessite une configuration de boîte d'ancrage, ce qui peut compliquer la configuration pour des ensembles de données très variés ou personnalisés.
  • Précision globale (mAP) inférieure à celle des architectures modernes sans ancrage telles que YOLOv8 YOLO26.

En savoir plus sur YOLOv5

Comparaison des performances

Lors de l'évaluation de ces modèles, il est primordial de trouver un compromis satisfaisant entre vitesse et précision. Le tableau ci-dessous présente les indicateurs de performance des deux architectures évaluées sur l'COCO . CPU ont été mesurées à l'aide de ONNX, tandis que GPU ont été testées à l'aide de TensorRT.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Alors que YOLOv5 un léger avantage en termes de nombre de paramètres et de vitesse brute absolue pour sa variante Nano, YOLOv8 une amélioration considérable du mAP les domaines, offrant un équilibre de performances bien plus solide pour les scénarios de déploiement exigeants dans le monde réel.

Facilité d'utilisation et Ultralytics

Une caractéristique déterminante des Ultralytics modernes est l'écosystème bien entretenu qui les entoure. La transition de YOLOv5 YOLOv8 l'introduction de l'unification ultralytics paquet pip, créant une expérience utilisateur hautement rationalisée.

Les développeurs peuvent gérer de manière transparente l'entraînement, la validation, la prédiction et l'exportation des modèles à l'aide de quelques lignes de Python seulement, sans avoir à recourir aux scripts standard complexes qui étaient auparavant nécessaires dans les projets d'apprentissage profond.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

De plus, l'intégration avec des outils tels que Ultralytics simplifie la gestion des ensembles de données, la formation au cloud et le déploiement, garantissant ainsi un développement actif et un solide soutien communautaire.

Cas d'utilisation idéaux

Quand choisir YOLOv5: Si vous gérez des systèmes hérités, effectuez des inférences sur des processeurs fortement limités tels que ceux du Raspberry Pi, ou travaillez sur un projet où chaque fraction de mégaoctet économisée dans la taille du modèle est cruciale, YOLOv5 un outil fiable et performant.

Quand choisir YOLOv8: Pour pratiquement tous les nouveaux projets démarrant aujourd'hui, YOLOv8 fortement recommandé plutôt que YOLOv5. Son architecture avancée gère sans effort le suivi complexe, les boîtes englobantes orientées (OBB) et la segmentation. Il est idéal pour les applications modernes allant de la robotique autonome à l'analyse d'images médicales et aux infrastructures de villes intelligentes.

Vous recherchez les dernières innovations technologiques ?

Bien que YOLOv8 incroyablement performant, les développeurs à la recherche de performances absolues devraient envisager YOLO26. Lancé en 2026, il présente plusieurs avancées révolutionnaires :

  • Conception NMS de bout en bout : élimine NMS pour un déploiement plus rapide et plus simple, un concept lancé pour la première fois dans YOLOv10.
  • MuSGD Optimizer : un hybride de SGD Muon qui apporte les innovations de la formation LLM à la vision par ordinateur, permettant une formation plus stable et une convergence plus rapide.
  • CPU jusqu'à 43 % plus rapide : fortement optimisé pour les environnements informatiques de pointe sans GPU dédiés.
  • Suppression de DFL : la perte focale de distribution a été supprimée afin de simplifier l'exportation et d'améliorer la compatibilité des périphériques.
  • ProgLoss + STAL : fonctions de perte avancées qui apportent des améliorations notables dans la reconnaissance des petits objets, ce qui est essentiel pour l'imagerie aérienne et l'IoT.

En tirant parti de la documentation complète et des outils fournis par Ultralytics, vous pouvez facilement déployer YOLOv8 ou explorer le tout dernier YOLO26 afin de résoudre des défis visuels complexes avec une rapidité et une précision sans précédent. Pour en savoir plus, consultez nos guides sur le réglage des hyperparamètres et les pratiques de déploiement de modèles.


Commentaires