Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 vs YOLO26#

L'évolution rapide de la vision par ordinateur repousse continuellement les limites de la vitesse, de la précision et de l'efficacité du déploiement. Dans le domaine de la détection d'objets en temps réel, Ultralytics établit constamment la norme. Cette comparaison technique explore la transition du très performant YOLO11 vers le révolutionnaire YOLO26, en analysant leurs architectures, leurs métriques de performance et leurs scénarios de déploiement idéaux.

Que tu construises des systèmes de livraison par drone ou que tu optimises un pipeline de fabrication intelligente mondial, comprendre les différences nuancées entre ces deux modèles t'aidera à créer des solutions IA robustes et pérennes.

Link to this sectionLignée des modèles et écosystème#

Les deux modèles bénéficient de l'écosystème complet Ultralytics, caractérisé par son API intuitive, sa maintenance continue et une communauté dynamique. Ils offrent une polyvalence inégalée, prenant naturellement en charge dès le départ la détection d'objets, la segmentation d'instance, la classification d'images, l' estimation de pose et les tâches de boîtes englobantes orientées (OBB).

Link to this sectionYOLO11 : La norme établie#

Sorti fin 2024, YOLO11 a affiné les avancées des générations précédentes, consolidant sa place de valeur sûre pour les environnements de production.

En savoir plus sur YOLO11

Link to this sectionYOLO26 : La nouvelle frontière#

Introduit début 2026, YOLO26 représente un changement de paradigme dans l'informatique en périphérie (edge computing) et l'architecture de bout en bout, offrant des améliorations significatives en termes de vitesse de traitement et de facilité d'intégration.

En savoir plus sur YOLO26

Gestion des données et déploiements

YOLO11 et YOLO26 sont entièrement intégrés à la plateforme Ultralytics, offrant des flux de travail fluides sans code pour l'annotation des jeux de données, l'entraînement dans le cloud et la surveillance de flotte.

Link to this sectionInnovations architecturales#

Alors que YOLO11 s'appuie sur des méthodes de post-traitement traditionnelles qui propulsent la vision par ordinateur depuis des années, YOLO26 introduit plusieurs percées structurelles conçues pour éliminer les goulots d'étranglement.

Link to this sectionConception intégrale sans NMS#

L'une des mises à niveau les plus significatives de YOLO26 est son architecture nativement de bout en bout. Elle élimine le post-traitement de suppression non maximale (NMS), un concept introduit pour la première fois dans YOLOv10. Contourner NMS simplifie radicalement le pipeline de déploiement et garantit une latence constante, ce qui est essentiel pour les applications en temps réel telles que les algorithmes de conduite autonome.

Link to this sectionSuppression du DFL pour l'optimisation en périphérie#

YOLO26 supprime la fonction de perte de focalisation de distribution (DFL). Bien que le DFL fût utile dans YOLO11 pour une localisation fine, sa suppression simplifie le graphe d'exportation du réseau. Cette modification assure une meilleure compatibilité avec le matériel à faible consommation, faisant de YOLO26 une véritable centrale sur les appareils en périphérie comme le Raspberry Pi ou le NVIDIA Jetson.

Link to this sectionOptimiseur MuSGD#

S'inspirant des mécanismes d'entraînement des modèles de langage (LLM), notamment Kimi K2 de Moonshot AI, YOLO26 utilise l'optimiseur révolutionnaire MuSGD. Cet hybride entre la descente de gradient stochastique (SGD) et Muon permet des exécutions d'entraînement remarquablement stables, convergeant beaucoup plus rapidement que les optimiseurs AdamW standard utilisés dans les architectures plus anciennes.

Link to this sectionFonctions de perte avancées#

YOLO26 intègre ProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning). Cette combinaison améliore considérablement la détection d'objets petits et densément regroupés. De plus, YOLO26 introduit des améliorations spécifiques aux tâches : un prototype multi-échelle dédié pour la segmentation sémantique, l'estimation de log-vraisemblance résiduelle (RLE) pour les estimations de pose humaine complexes, et une perte angulaire spécialisée pour atténuer les problèmes de bordure dans les tâches de détection OBB.

Link to this sectionComparaison des performances#

Lors de l'évaluation de ces modèles, l'équilibre entre le nombre de paramètres, la complexité computationnelle (FLOPs) et la vitesse dicte le choix du matériel. YOLO26 cible spécifiquement la vitesse d'inférence CPU, atteignant une inférence CPU jusqu'à 43 % plus rapide par rapport à son prédécesseur.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9
YOLO26n64040.938.91,72.45.4
YOLO26s64048.687.22.59,520.7
YOLO26m64053.1220.04.720,468,2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Comme démontré, le YOLO26 Nano (YOLO26n) fait un bond significatif en précision tout en réduisant le temps d'inférence CPU de 56,1 ms à 38,9 ms avec ONNX Runtime.

Exporter pour une vitesse maximale

Pour tirer le maximum de performance de ces modèles, exporte-les en utilisant TensorRT sur le matériel NVIDIA ou OpenVINO pour les CPU Intel. La conception sans NMS de YOLO26 rend ce processus d'exportation plus fluide que jamais.

Link to this sectionCas d'utilisation et applications réelles#

Le choix entre YOLO11 et YOLO26 dépend largement de ton infrastructure spécifique et des objectifs de ton projet.

Link to this sectionEdge Computing et IoT#

Pour les applications contraintes par l'énergie et le matériel, comme la surveillance de l'agriculture intelligente par drone ou les systèmes d'alarme de sécurité locaux, YOLO26 est le champion incontesté. La suppression du DFL et le gain de 43 % en vitesse CPU te permettent d'exécuter des modèles de vision complexes sur des appareils sans GPU dédié, tout en maintenant des fréquences d'images élevées.

Link to this sectionCloud et échelle d'entreprise#

YOLO11 reste un choix exceptionnel pour les solutions d'entreprise où de vastes fermes de serveurs sont déjà optimisées pour ses structures tensorielles. Il convient parfaitement à l' analyse vidéo basée sur le cloud et aux pipelines de traitement multimédia à grande échelle qui sont déjà profondément intégrés à ses formats de sortie spécifiques.

Link to this sectionMultitâche complexe#

Si ton projet nécessite une précision extrême sur de minuscules objets—comme la détection de défauts sur une carte de circuit imprimé ou le suivi de véhicules distants dans de l' imagerie aérienne—l'implémentation de ProgLoss + STAL dans YOLO26 fournit une amélioration notable du rappel et de la précision pour ces cas limites difficiles.

Link to this sectionEfficacité de l'entraînement et exigences en mémoire#

Un avantage majeur du framework Ultralytics est son empreinte mémoire incroyablement faible pendant l'entraînement. Contrairement aux énormes transformateurs de vision comme RT-DETR ou l'ancien YOLOv8 qui peuvent consommer des quantités massives de mémoire CUDA, YOLO11 et YOLO26 sont optimisés pour s'entraîner efficacement sur du matériel grand public.

L'intégration de l'optimiseur MuSGD dans YOLO26 améliore encore cela en garantissant que le modèle trouve les poids optimaux plus rapidement, réduisant ainsi les heures de calcul GPU globales et les coûts de calcul dans le cloud.

Voici un exemple simple démontrant à quel point il est facile d'entraîner le dernier modèle YOLO26 en utilisant l'API Python native :

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Link to this sectionExploration d'architectures alternatives#

Bien que YOLO26 représente le summum de la détection en temps réel, explorer d'autres modèles au sein de la documentation Ultralytics peut être bénéfique. Pour les utilisateurs liés à des environnements existants (legacy), des architectures antérieures comme YOLOv5 fournissent toujours des performances robustes. Pour les capacités de zero-shot où définir les classes à l'avance n'est pas possible, YOLO-World offre une détection à vocabulaire ouvert alimentée par des invites textuelles.

Link to this sectionConclusion#

Le passage de YOLO11 à YOLO26 n'est pas simplement une mise à jour incrémentale ; c'est une réimagination structurelle de la manière dont les modèles de détection d'objets en temps réel fonctionnent en production. En abandonnant les étapes de post-traitement complexes et en optimisant pour une exécution centrée sur l'edge, YOLO26 se distingue comme le choix de premier ordre pour les développeurs modernes. Soutenu par le robuste écosystème Ultralytics et une documentation complète, passer à YOLO26 garantit des déploiements plus rapides, un entraînement stable et une précision SOTA pour pratiquement n'importe quelle tâche de vision par ordinateur.

Contributeurs

Commentaires