YOLOv8 vs YOLOv10 : une comparaison technique complète

Choisir le bon modèle de détection d'objets est essentiel au succès de tout projet de vision par ordinateur. Ce guide fournit une comparaison technique détaillée entre Ultralytics YOLOv8 et YOLOv10, en analysant leurs innovations architecturales, leurs mesures de performance et leurs cas d'utilisation idéaux. Alors que YOLOv10 introduit de nouvelles optimisations d'efficacité, Ultralytics YOLOv8 reste une force dominante en raison de son écosystème robuste, de sa polyvalence inégalée et de sa fiabilité éprouvée dans divers scénarios de déploiement.

Ultralytics YOLOv8 : La norme polyvalente

Lancé en janvier 2023, Ultralytics YOLOv8 représente un bond en avant significatif dans la série YOLO, conçu non seulement comme un modèle, mais comme un cadre complet pour l'IA de vision. Il privilégie la convivialité et la flexibilité, ce qui en fait le choix idéal pour les développeurs, des amateurs aux ingénieurs d'entreprise.

Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation :Ultralytics
Date : 2023-01-10
GitHub :ultralytics/ultralytics
Docs :Documentation YOLOv8

Architecture et capacités

YOLOv8 utilise un mécanisme de détection sans ancres, ce qui simplifie le processus d'entraînement en éliminant le besoin de spécification manuelle des boîtes d'ancrage. Cette approche améliore la généralisation à travers différentes formes d'objets. Son architecture comprend une tête découplée et un backbone à la pointe de la technologie qui équilibre le coût de calcul avec une haute précision.

Une caractéristique déterminante de YOLOv8 est sa prise en charge multi-tâches native. Contrairement à de nombreux modèles spécialisés, YOLOv8 offre des fonctionnalités prêtes à l'emploi pour :

Avantages clés

L'écosystème bien maintenu entourant YOLOv8 est un avantage considérable. Il s'intègre parfaitement avec Ultralytics HUB pour la formation et la gestion des modèles, et offre de nombreuses options d'exportation vers des formats tels que ONNX, TensorRT et CoreML. De plus, ses besoins en mémoire pendant la formation et l'inférence sont considérablement inférieurs à ceux des architectures basées sur les transformateurs, ce qui garantit un fonctionnement efficace sur le matériel standard.

En savoir plus sur YOLOv8

YOLOv10 : Repousser les limites de l'efficacité

YOLOv10, développé par des chercheurs de l’université de Tsinghua, se concentre fortement sur l’optimisation du pipeline d’inférence en supprimant les goulots d’étranglement associés au post-traitement.

Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation :Tsinghua University
Date : 2024-05-23
Arxiv :arXiv:2405.14458
GitHub :THU-MIG/yolov10
Docs :Documentation YOLOv10

Innovations architecturales

La caractéristique principale de YOLOv10 est sa stratégie d'apprentissageNMS. Les détecteurs d'objets traditionnels s'appuient sur la suppression non maximale (NMS) pour filtrer les boîtes de délimitation qui se chevauchent pendant l'inférence, ce qui peut entraîner des temps de latence. YOLOv10 utilise des affectations doubles cohérentes au cours de la formation, en combinant la supervision un-à-plusieurs pour des signaux de supervision riches avec l'appariement un-à-un pour une inférence efficace. Cela permet au modèle de prédire des boîtes de délimitation exactes sans avoir besoin de NMS, réduisant ainsi la latence de bout en bout.

L'architecture comprend également une conception holistique axée sur l'efficacité et la précision, avec des têtes de classification légères et un sous-échantillonnage spatial-canal découplé pour réduire la redondance de calcul (FLOPs) et le nombre de paramètres.

En savoir plus sur YOLOv10

Métriques de performance et analyse

Lors de la comparaison de ces deux modèles, il est essentiel de regarder au-delà des simples chiffres de précision. Bien que YOLOv10 montre une efficacité impressionnante en termes de paramètres, YOLOv8 maintient des performances robustes sur une plus grande variété de matériel et de tâches.

Tableau comparatif

Le tableau ci-dessous met en évidence les performances sur l'ensemble de données COCO. YOLOv10 atteint un mAP plus élevé avec moins de paramètres dans certains cas, mais YOLOv8 reste très compétitif en termes de vitesse d'inférence, en particulier sur les benchmarks CPU et GPU standard.

Modèle	Taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	paramètres ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

Analyse critique

Équilibre des performances : YOLOv8 offre un excellent compromis entre vitesse et précision. Ses vitesses sur CPU (via ONNX) sont bien documentées et optimisées, ce qui en fait un choix fiable pour les déploiements ne disposant pas de matériel GPU spécialisé.
Efficacité de l'entraînement : Les modèles Ultralytics sont connus pour leurs processus d'entraînement efficaces. Les utilisateurs peuvent souvent obtenir une convergence plus rapide grâce aux hyperparamètres optimisés de YOLOv8 et aux poids pré-entraînés facilement disponibles.
Maturité de l'écosystème : Bien que YOLOv10 offre des gains d'efficacité théoriques, YOLOv8 bénéficie d'années de perfectionnement dans l'écosystème Ultralytics. Cela comprend un support étendu pour l'augmentation des données, le débogage actif de la communauté et les intégrations avec des outils tels que Weights & Biases et Comet.

La polyvalence, c'est important

Si votre projet nécessite plus que de simples boîtes englobantes, comme la compréhension du langage corporel via l'estimation de pose ou la délimitation précise des frontières via la segmentation, YOLOv8 est le grand gagnant, car YOLOv10 est actuellement spécialisé principalement dans la détection d'objets.

Cas d'utilisation idéaux

Quand choisir Ultralytics YOLOv8

YOLOv8 est le choix recommandé pour la grande majorité des applications réelles en raison de sa polyvalence et de sa facilité d'utilisation.

Solutions d'IA multi-facettes : Parfait pour les projets nécessitant la segmentation d'instance ou la classification en plus de la détection.
Déploiement en entreprise : Idéal pour les entreprises qui ont besoin d'un cadre stable et pris en charge avec des options de licence claires et une intégration dans les pipelines MLOps existants.
Vente au détail intelligente : Sa capacité à gérer plusieurs tâches la rend adaptée aux analyses de vente au détail complexes comme la surveillance des rayons et l'analyse du comportement des clients.
Prototypage rapide : L’API python simple permet aux développeurs de passer du concept au modèle entraîné en quelques minutes.

Quand choisir YOLOv10

YOLOv10 est mieux réservé aux niches spécifiques où les contraintes matérielles sont extrêmes.

IA en périphérie essentielle à la latence : Applications sur les microcontrôleurs ou les systèmes embarqués existants où chaque milliseconde de latence d'inférence compte.
Traitement vidéo à haut débit : Scénarios comme la gestion du trafic où la réduction du temps de post-traitement par trame peut cumulativement économiser des ressources de calcul importantes.

Implémentation du code

L'une des caractéristiques de l'écosystème Ultralytics est la facilité d'utilisation. Les deux modèles sont accessibles via le ultralytics Package Python, garantissant une expérience développeur cohérente.

Voici un exemple de la façon d'exécuter l'inférence avec YOLOv8, démontrant la simplicité de l'API.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Perform object detection on a local image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

De même, comme Ultralytics prend en charge l'écosystème au sens large, vous pouvez souvent échanger facilement des poids pour expérimenter d'autres architectures, à condition qu'elles soient prises en charge dans la bibliothèque.

Exportation transparente

Ultralytics fournit une commande d'une seule ligne pour exporter vos modèles entraînés vers des formats adaptés au déploiement. Cela fonctionne parfaitement avec YOLOv8 pour générer des modèles optimisés pour la production :

# Export YOLOv8 model to ONNX format
model.export(format="onnx")

Conclusion

YOLOv8 et YOLOv10 sont tous deux des prouesses impressionnantes d'ingénierie de la vision par ordinateur. YOLOv10 repousse les limites de l'efficacité architecturale avec sa conception sans NMS, ce qui en fait un concurrent de taille pour les tâches de détection hautement spécialisées et sensibles à la latence.

Cependant, pour un développement robuste, polyvalent et à l'épreuve du temps, Ultralytics YOLOv8 reste le choix supérieur. Sa capacité à gérer la classification, la segmentation et l'estimation de pose dans un seul framework offre une valeur inégalée. Associé à la documentation complète, au support actif de la communauté et à l'intégration transparente avec Ultralytics HUB, YOLOv8 permet aux développeurs de créer des solutions d'IA complètes plus rapidement et de manière plus fiable.

Pour ceux qui recherchent le nec plus ultra en matière de performances, nous vous recommandons également d'explorer YOLO11, qui s'appuie sur les points forts de YOLOv8 pour offrir une précision et une vitesse encore plus grandes.