Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 contre YOLOv10#

Le paysage de la vision par ordinateur évolue constamment, porté par la demande en modèles plus rapides, plus précis et plus efficaces. Ce guide propose une comparaison technique approfondie entre deux architectures révolutionnaires dans le domaine de la détection d'objets en temps réel : YOLO26 et YOLOv10. En analysant leurs architectures, leurs métriques de performance et leurs capacités de déploiement, nous t'aidons, en tant que développeur ou chercheur, à choisir le modèle optimal pour tes applications de vision.

Link to this sectionL'évolution des architectures sans NMS#

Pendant des années, la famille YOLO (You Only Look Once) s'est fortement appuyée sur la Non-Maximum Suppression (NMS) pour filtrer les boîtes englobantes redondantes lors du post-traitement. Bien qu'efficace, le NMS introduit une latence d'inférence et complique le déploiement sur des appareils de pointe comme le Raspberry Pi ou des unités de traitement neuronal (NPUs) spécialisées.

L'introduction de YOLOv10 a représenté un changement de paradigme en ouvrant la voie à une conception end-to-end sans NMS. S'appuyant sur cette avancée fondamentale, Ultralytics YOLO26 a affiné l'architecture pour les environnements de production, atteignant une efficacité et une facilité d'utilisation inégalées pour une plus grande variété de tâches.

Le goulot d'étranglement du post-traitement

Supprimer le NMS élimine l'étape de post-traitement dynamique et dépendante des données qui entravait traditionnellement l'optimisation des modèles de vision par ordinateur sur des accélérateurs matériels comme TensorRT et OpenVINO.

Link to this sectionYOLOv10 : Pionnier de la détection sans NMS#

Date : 23-05-2024
Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation : Tsinghua University
Ressources : ArXiv Paper | GitHub Repository

Développé par des chercheurs de l'université Tsinghua, YOLOv10 a introduit une stratégie d'assignation double cohérente pour éliminer le besoin de NMS. En utilisant une conception de modèle globale axée sur l'efficacité et la précision, il a réduit la redondance computationnelle tout en maintenant un mAP (mean Average Precision) élevé.

Points forts :

  • Architecture sans NMS : Le pionnier original de la conception sans NMS dans la série YOLO, réduisant drastiquement la latence pour les applications en temps réel.
  • Efficacité : Offre un excellent compromis entre le nombre de paramètres et la vitesse d'inférence par rapport aux modèles de générations précédentes.

Points faibles :

  • Prise en charge limitée des tâches : Principalement concentré sur la détection d'objets standard, sans support natif immédiat pour des tâches avancées comme la segmentation ou l'estimation de pose.
  • Orientation académique : La base de code, bien que robuste, penche davantage vers la recherche que vers un déploiement en production rationalisé et de qualité professionnelle.

En savoir plus sur YOLOv10

Link to this sectionYOLO26 : Le nouveau standard pour l'edge et le cloud#

Date : 14-01-2026
Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Ressources : GitHub Repository | Ultralytics Platform

Sorti en tant que successeur de YOLO11, YOLO26 pousse le concept sans NMS à sa réalisation ultime. Il intègre nativement la détection end-to-end dans la plateforme Ultralytics hautement optimisée, offrant une suite complète d'outils pour le pipeline moderne d'apprentissage automatique.

YOLO26 introduit plusieurs percées architecturales :

  • Suppression du DFL : La Distribution Focal Loss a été complètement supprimée. Cela simplifie considérablement le processus d'exportation du modèle et améliore la compatibilité avec les appareils de pointe et à faible consommation.
  • Inférence CPU jusqu'à 43 % plus rapide : Grâce à la suppression du DFL et aux optimisations structurelles, YOLO26 est nettement plus rapide sur les CPU, ce qui le rend idéal pour les déploiements IoT et mobiles.
  • Optimiseur MuSGD : Inspiré par les techniques d'entraînement des grands modèles de langage (LLM) (telles que le Kimi K2 de Moonshot AI), YOLO26 utilise un hybride de SGD et Muon. Cela apporte une stabilité d'entraînement sans précédent et une convergence plus rapide à la vision par ordinateur.
  • ProgLoss + STAL : Ces fonctions de perte avancées permettent des améliorations notables dans la reconnaissance des petits objets, ce qui est essentiel pour l'imagerie aérienne et la surveillance de sécurité par drone.
  • Améliorations spécifiques aux tâches : YOLO26 n'est pas seulement un détecteur. Il propose une perte de segmentation sémantique et un proto multi-échelle pour la segmentation, l'estimation de log-vraisemblance résiduelle (RLE) pour l'estimation de pose, et une perte d'angle spécialisée pour les boîtes englobantes orientées (OBB).

En savoir plus sur YOLO26

Link to this sectionAnalyse des performances et métriques#

Le tableau suivant compare les performances de détection COCO des modèles YOLO26 et YOLOv10. Remarque comment YOLO26 atteint une précision supérieure tout en conservant une efficacité exceptionnelle en termes de paramètres.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040,938.91,72,45.4
YOLO26s64048,687.22.59,520,7
YOLO26m64053,1220.04.720,468,2
YOLO26l64055,0286.26.224,886,4
YOLO26x64057.5525.811.855,7193,9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054,4-12.256,9160.4

Link to this sectionL'avantage Ultralytics : Efficacité de l'entraînement et de la mémoire#

Lors du déploiement de modèles en production, les besoins en mémoire et l'efficacité de l'entraînement sont tout aussi cruciaux que la vitesse d'inférence. Les modèles Ultralytics, en particulier YOLO26, sont hautement optimisés pour réduire l'utilisation de la mémoire CUDA pendant l'entraînement. Cela permet aux développeurs d'utiliser des batch sizes plus grands sur des GPU grand public, réduisant considérablement le temps d'entraînement et les coûts de calcul. À l'inverse, les architectures complexes ou les modèles de type Transformer lourds comme RT-DETR nécessitent souvent du matériel coûteux et haut de gamme pour être entraînés efficacement.

Intégration continue et écosystème

L'un des plus grands avantages de choisir YOLO26 est son intégration avec l'écosystème Ultralytics, maintenu avec soin. De l'annotation de données au suivi d'expériences, la plateforme fournit tout ce dont un ingénieur en apprentissage automatique a besoin sous un même toit.

Link to this sectionMise en œuvre pratique : Exemple de code#

La marque de fabrique d'Ultralytics est sa facilité d'utilisation inégalée dans l'industrie. Avec une API Python intuitive, migrer d'un modèle hérité comme YOLOv8 vers le YOLO26 de pointe ne nécessite de mettre à jour qu'une seule ligne de code.

Voici un exemple 100 % exécutable démontrant comment entraîner et effectuer une inférence en utilisant YOLO26 :

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLO26 et YOLOv10 dépend de tes exigences de projet spécifiques, des contraintes de déploiement et des préférences concernant l'écosystème.

Link to this sectionQuand choisir YOLO26#

YOLO26 est un choix judicieux pour :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionQuand choisir YOLOv10#

YOLOv10 est recommandé pour :

  • Détection temps réel sans NMS : Applications bénéficiant d'une détection de bout en bout sans NMS (Non-Maximum Suppression), ce qui réduit la complexité du déploiement.
  • Compromis vitesse-précision équilibré : Projets nécessitant un bon équilibre entre la vitesse d'inférence et la précision de détection pour différentes tailles de modèles.
  • Applications à latence constante : Scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, comme dans la robotique ou les systèmes autonomes.

Link to this sectionConclusion#

Bien que YOLOv10 ait apporté des contributions significatives à la communauté académique en introduisant le paradigme sans NMS, YOLO26 hisse cette technologie au niveau de préparation requis pour l'entreprise. Avec son augmentation remarquable de 43 % de la vitesse CPU, son optimiseur innovant MuSGD et sa polyvalence inégalée sur les tâches de vision, YOLO26 s'impose comme le choix ultime pour l'Edge computing et les déploiements cloud à grande échelle.

Pour les équipes qui privilégient une communauté active, une documentation complète et une expérience développeur fluide, l'écosystème Ultralytics est sans égal. Si tu explores des modèles pour des scénarios spécialisés, tu peux également jeter un œil à YOLO-World pour la détection à vocabulaire ouvert zero-shot. Cependant, pour la grande majorité des cas d'utilisation réels, YOLO26 est la recommandation définitive.

Contributeurs

Commentaires