Passer au contenu

YOLO26 vs YOLOv10: comparaison des modèles de détection d'objets de bout en bout

Le domaine de la vision par ordinateur est en constante évolution, poussé par la demande de modèles plus rapides, plus précis et plus efficaces. Ce guide propose une comparaison technique complète entre deux architectures révolutionnaires dans le domaine de la détection d'objets en temps réel : YOLO26 et YOLOv10. En analysant leurs architectures, leurs mesures de performance et leurs capacités de déploiement, nous souhaitons aider les développeurs et les chercheurs à choisir le modèle optimal pour leurs applications de vision.

L'évolution des architectures NMS

Pendant des années, la famille YOLO You Only Look Once) s'est fortement appuyée sur la suppression non maximale (NMS) pour filtrer les cadres de sélection redondants lors du post-traitement. Bien qu'efficace, NMS une latence d'inférence et complique le déploiement sur des appareils périphériques tels que le Raspberry Pi ou les unités de traitement neuronal (NPU) spécialisées.

L'introduction de YOLOv10 un changement de paradigme en inaugurant une conception de bout en bout NMS. S'appuyant sur cette avancée fondamentale, Ultralytics a perfectionné l'architecture pour les environnements de production, atteignant une efficacité et une facilité d'utilisation sans précédent pour une plus grande variété de tâches.

Le goulot d'étranglement du post-traitement

La suppression NMS l'étape de post-traitement dynamique et dépendante des données qui, traditionnellement, entravait l'optimisation des modèles de vision par ordinateur sur les accélérateurs matériels tels que TensorRT et OpenVINO.

YOLOv10: pionnier de la détection NMS

Date : 23 mai 2024
Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation :Université Tsinghua
Ressources :Article ArXiv | Référentiel GitHub

Développé par des chercheurs de l'université Tsinghua, YOLOv10 une stratégie cohérente à double affectation afin d'éliminer le besoin de NMS. En employant une conception de modèle holistique axée sur l'efficacité et la précision, il a réduit la redondance informatique tout en conservant mAP forte mAP précision moyenne).

Points forts :

  • ArchitectureNMS: pionnier original de la conception NMS dans la YOLO , réduisant considérablement la latence pour les applications en temps réel.
  • Efficacité : offre un excellent compromis entre le nombre de paramètres et la vitesse d'inférence par rapport aux modèles de la génération précédente.

Faiblesses :

  • Prise en charge limitée des tâches : principalement axé sur la détection d'objets standard, ne prend pas en charge nativement les tâches avancées telles que la segmentation ou l'estimation de pose.
  • Orientation académique : le code source, bien que robuste, est davantage axé sur la recherche que sur un déploiement rationalisé et adapté à la production en entreprise.

En savoir plus sur YOLOv10

YOLO26 : la nouvelle norme pour la périphérie et le cloud

Date : 14/01/2026
Auteurs : Glenn Jocher et Jing Qiu
Organisation :Ultralytics
Ressources :Référentiel GitHub | Ultralytics

Sorti en tant que successeur de YOLO11, YOLO26 porte le concept NMS à son paroxysme. Il intègre nativement la détection de bout en bout dans la Ultralytics hautement optimisée, offrant ainsi une suite complète d'outils pour le pipeline moderne d'apprentissage automatique.

YOLO26 présente plusieurs avancées architecturales :

  • Suppression du DFL : la perte focale de distribution a été complètement supprimée. Cela simplifie considérablement le processus d'exportation du modèle et améliore la compatibilité avec les appareils périphériques et à faible consommation d'énergie.
  • CPU jusqu'à 43 % plus rapide : grâce à la suppression du DFL et aux optimisations structurelles, YOLO26 est nettement plus rapide sur les CPU, ce qui le rend idéal pour les déploiements IoT et mobiles.
  • Optimiseur MuSGD : inspiré des techniques d'entraînement des grands modèles linguistiques (LLM) (tels que Kimi K2 de Moonshot AI), YOLO26 utilise un hybride de SGD Muon. Cela apporte une stabilité d'entraînement inégalée et une convergence plus rapide à la vision par ordinateur.
  • ProgLoss + STAL : ces fonctions de perte avancées apportent des améliorations notables dans la reconnaissance des petits objets, ce qui est essentiel pour l'imagerie aérienne et la surveillance de sécurité par drone.
  • Améliorations spécifiques à certaines tâches : YOLO26 n'est pas seulement un détecteur. Il intègre la perte de segmentation sémantique et le proto multi-échelle pour la segmentation, l'estimation de la vraisemblance logarithmique résiduelle (RLE) pour l'estimation de la pose, et la perte angulaire spécialisée pour les boîtes englobantes orientées (OBB).

En savoir plus sur YOLO26

Analyse et mesures des performances

Le tableau suivant compare les performances COCO YOLOv10 YOLO26 et YOLOv10 . Notez comment YOLO26 atteint une précision supérieure tout en conservant une efficacité exceptionnelle des paramètres.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics : efficacité de la formation et de la mémoire

Lors du déploiement de modèles en production, les exigences en matière de mémoire et l'efficacité de la formation sont tout aussi cruciales que la vitesse d'inférence. Ultralytics , en particulier YOLO26, sont hautement optimisés pour réduire l'utilisation CUDA pendant la formation. Cela permet aux développeurs d'utiliser des lots plus importants sur des GPU grand public, ce qui réduit considérablement le temps de formation et les coûts de calcul. À l'inverse, les architectures complexes ou les modèles de transformateurs lourds comme RT-DETR nécessitent souvent du matériel haut de gamme coûteux pour s'entraîner efficacement.

Intégration continue et écosystème

L'un des principaux avantages de YOLO26 réside dans son intégration à Ultralytics , qui bénéficie d'une maintenance rigoureuse. De l'annotation des données au suivi des expériences, la plateforme offre tout ce dont un ingénieur en apprentissage automatique a besoin sous un même toit.

Mise en œuvre pratique : exemple de code

La marque de fabrique Ultralytics sa facilité d'utilisation, leader dans le secteur. Grâce à une Python intuitive, la migration depuis un modèle existant tel que YOLOv8 vers le modèle de pointe YOLO26 ne nécessite que la mise à jour d'une seule ligne de code.

Voici un exemple 100 % exécutable qui montre comment entraîner et inférer à l'aide de YOLO26 :

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Cas d'utilisation et recommandations

Le choix entre YOLO26 et YOLOv10 des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.

Quand choisir YOLO26

YOLO26 est un choix judicieux pour :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Quand choisir YOLOv10

YOLOv10 recommandé pour :

  • Détection en temps réelNMS: applications bénéficiant d'une détection de bout en bout sans suppression non maximale, réduisant ainsi la complexité du déploiement.
  • Compromis équilibré entre vitesse et précision : projets nécessitant un équilibre solide entre la vitesse d'inférence et la précision de détection à différentes échelles de modèle.
  • Applications à latence constante : scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, tels que la robotique ou les systèmes autonomes.

Conclusion

Alors que YOLOv10 une contribution significative à la communauté universitaire en introduisant le paradigme NMS, YOLO26 élève cette technologie au niveau de l'entreprise. Avec son augmentation remarquable de 43 % de CPU , son optimiseur MuSGD innovant et sa polyvalence inégalée dans les tâches de vision, YOLO26 s'impose comme le choix ultime pour l'informatique de pointe et les déploiements cloud à grande échelle.

Pour les équipes qui privilégient une communauté active, une documentation complète et une expérience développeur fluide, Ultralytics est sans égal. Si vous explorez des modèles pour des scénarios spécialisés, vous pouvez également vous intéresser à YOLO pour la détection à vocabulaire ouvert sans apprentissage préalable. Cependant, pour la grande majorité des cas d'utilisation réels, YOLO26 est la recommandation incontournable.


Commentaires