Passer au contenu

YOLOv10 YOLO26 : une nouvelle ère pour la détection d'objets de bout en bout

L'évolution de la détection d'objets en temps réel a connu des progrès rapides ces dernières années, l'accent étant mis sur l'équilibre entre vitesse, précision et facilité de déploiement. Cette comparaison explore deux étapes importantes de cette évolution : YOLOv10, une avancée académique qui a popularisé la détection NMS, et YOLO26, la dernière puissance prête à l'emploi Ultralytics affine ces concepts pour les applications de niveau entreprise.

Aperçu du modèle

YOLOv10: le pionnier universitaire

Publié en mai 2024 par des chercheurs de l'université Tsinghua, YOLOv10 un changement de paradigme en éliminant le besoin de suppression non maximale (NMS) pendant l'inférence. Cette approche « de bout en bout » a permis de résoudre un problème de longue date dans les pipelines de déploiement, où la latence du post-traitement variait souvent de manière imprévisible en fonction de la densité de la scène.

En savoir plus sur YOLOv10

YOLO26 : la norme industrielle

S'appuyant sur les fondations posées par ses prédécesseurs, YOLO26 (sorti en janvier 2026) est la solution de pointe Ultralytics conçue pour avoir un impact réel. Elle adopte la conception End-to-End NMS lancée par YOLOv10 l'améliore avec des fonctions de perte plus simples, un optimiseur novateur et des améliorations considérables en termes de vitesse sur le matériel périphérique.

En savoir plus sur YOLO26

Comparaison technique

Les deux modèles visent à résoudre les problèmes de latence causés par NMS, mais ils empruntent des voies différentes pour y parvenir. YOLOv10 fortement YOLOv10 sur la recherche architecturale et les doubles affectations pour l'entraînement, tandis que YOLO26 privilégie la simplicité de déploiement, CPU et la stabilité de l'entraînement.

Architecture et conception

YOLOv10 a introduit les attributions doubles cohérentes pour l'entraînement NMS. Cette méthode associe une tête un-à-plusieurs (pour une supervision riche pendant l'entraînement) à une tête un-à-un (pour l'inférence), garantissant ainsi que le modèle apprend à produire une seule meilleure boîte par objet. Elle utilise également une conception de modèle holistique axée sur l'efficacité et la précision, comprenant des têtes de classification légères et un sous-échantillonnage découplé des canaux spatiaux.

YOLO26 affine cette approche en supprimant complètement la perte focale de distribution (DFL). Si la DFL contribuait à améliorer la précision des boîtes dans les versions précédentes, sa suppression simplifie considérablement le graphique d'exportation, ce qui facilite l'exécution des modèles YOLO26 sur des appareils périphériques restreints et des microcontrôleurs à faible consommation. De plus, YOLO26 intègre l'optimiseur MuSGD, un hybride de SGD de l'optimiseur Muon (inspiré de la formation LLM), qui apporte pour la première fois la stabilité de la formation par lots importants aux tâches de vision par ordinateur.

Mesures de performance

Le tableau suivant met en évidence les différences de performances. YOLO26 affiche une vitesse supérieure sur les processeurs et une plus grande précision à toutes les échelles de modèle, en particulier dans les variantes plus grandes.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Percée dans le domaine de CPU

YOLO26 est spécialement optimisé pour les environnements sans GPU dédiés. Il offre CPU jusqu'à 43 % plus rapide que les générations précédentes, ce qui en fait un véritable changement radical pour les déploiements Raspberry Pi et mobiles.

Cas d'utilisation et applications réelles

Quand choisir YOLOv10

YOLOv10 un excellent choix pour les chercheurs et les scénarios spécifiques de détection uniquement.

  • Recherche universitaire : sa stratégie à double affectation est un sujet fascinant qui mérite d'être approfondi dans le cadre de la conception de fonctions de perte.
  • Pipelines hérités NMS: si un projet a déjà été développé autour de laONNX YOLOv10 , il continue à fournir une détection fiable et à faible latence.

Pourquoi YOLO26 est le choix idéal pour la production

Pour la plupart des développeurs, YOLO26 offre une solution plus robuste et polyvalente.

L'avantage Ultralytics

Choisir un Ultralytics tel que YOLO26 offre des avantages qui vont bien au-delà des simples métriques brutes. L'écosystème intégré garantit que votre projet est pris en charge depuis la collecte des données jusqu'au déploiement final.

Expérience utilisateur simplifiée

La facilité d'utilisation offerte parPython Ultralytics est inégalée. Alors que d'autres référentiels peuvent nécessiter des scripts de configuration complexes, Ultralytics peuvent être chargés, entraînés et déployés avec un minimum de code.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

Assistance complète pour l'écosystème

YOLO26 est entièrement intégré à la Ultralytics , ce qui permet une gestion transparente des ensembles de données, une formation à distance et une exportation en un clic vers des formats tels que TensorRT, CoreML et OpenVINO. Cet écosystème bien entretenu vous garantit l'accès à des mises à jour fréquentes, à un forum communautaire dynamique et à une documentation complète pour résoudre tout problème.

Efficacité de l'entraînement et mémoire

Ultralytics sont réputés pour leur efficacité en matière d'entraînement. L'utilisation de l'optimiseur MuSGD par YOLO26 permet un entraînement stable avec des besoins en mémoire réduits par rapport aux modèles basés sur des transformateurs tels que RT-DETR. Cela signifie que vous pouvez former des modèles très précis sur des GPU grand public sans épuiser la mémoire VRAM, démocratisant ainsi l'accès aux capacités d'IA haut de gamme.

Conclusion

Ces deux architectures représentent des avancées significatives dans le domaine de la vision par ordinateur. YOLOv10 mérite d'être salué pour avoir popularisé l'approche NMS, prouvant ainsi que la détection de bout en bout est viable pour les applications en temps réel.

Cependant, YOLO26 reprend ce concept et l'affine pour répondre aux besoins pratiques de 2026. Avec ses CPU supérieures, sa prise en charge spécialisée des petits objets via ProgLoss et le soutien de Ultralytics , YOLO26 est le choix recommandé pour les développeurs qui cherchent à créer des solutions d'IA évolutives et pérennes. Que vous travailliez dans le domaine de l'analyse intelligente du commerce de détail, de la robotique autonome ou de la fabrication à grande vitesse, YOLO26 offre l'équilibre de performances nécessaire à votre réussite.

Autres modèles à explorer

  • YOLO11: le prédécesseur robuste de YOLO26, encore largement utilisé en production.
  • RT-DETR: une alternative basée sur un transformateur offrant une grande précision pour les scénarios où GPU sont abondantes.
  • YOLO: Idéal pour les tâches de détection à vocabulaire ouvert où les classes sont définies par des invites textuelles.

Commentaires