YOLO26 vs YOLO11 : Un bond générationnel en vision par ordinateur
Lors de la création de systèmes de vision par ordinateur de pointe, le choix du bon modèle est essentiel pour équilibrer précision, latence et efficacité des ressources. Dans le paysage en évolution rapide de l'intelligence artificielle, Ultralytics continue de repousser les limites de ce qui est possible. Cette comparaison technique détaillée explore la transition du très performant YOLO11 vers le nouveau et révolutionnaire YOLO26, offrant aux ingénieurs et chercheurs en IA les connaissances nécessaires pour prendre des décisions architecturales éclairées.
Lignée des modèles et métadonnées
Les deux modèles ont été développés par Ultralytics, mais ils représentent des paradigmes différents dans l'évolution de la détection d'objets et des modèles de vision multi-tâches.
Détails de YOLO26 :
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 2026-01-14
- GitHub : Dépôt Ultralytics
- Documentation : Documentation officielle de YOLO26
Détails de YOLO11 :
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : Dépôt Ultralytics
- Documentation : Documentation officielle de YOLO11
Différences architecturales et innovations
Le saut de YOLO11 à YOLO26 implique des changements fondamentaux à la fois dans l'architecture du modèle et dans le régime d'entraînement sous-jacent. Alors que YOLO11 a établi une base solide pour la détection d'objets et l'apprentissage multi-tâches, YOLO26 repense complètement le pipeline de déploiement pour l'informatique en périphérie (edge computing).
Conception de bout en bout sans NMS
L'une des mises à niveau les plus importantes de YOLO26 est son architecture nativement de bout en bout. Contrairement à YOLO11, qui repose sur le post-traitement Non-Maximum Suppression (NMS) pour filtrer les boîtes englobantes qui se chevauchent, YOLO26 élimine entièrement cette étape. Ce concept, initié pour la première fois dans YOLOv10, réduit considérablement la variabilité de la latence et simplifie la logique de déploiement sur divers appareils en périphérie.
Suppression du DFL pour l'efficacité en périphérie
YOLO11 utilise la Distribution Focal Loss (DFL) pour affiner les estimations des boîtes englobantes. Cependant, la DFL repose sur des opérations softmax complexes qui sont souvent mal prises en charge par les accélérateurs en périphérie à faible consommation. YOLO26 supprime avec succès la DFL sans sacrifier la précision. Cette simplification architecturale améliore considérablement la compatibilité avec les systèmes embarqués et permet à YOLO26 d'atteindre jusqu'à 43 % d'accélération de l'inférence CPU par rapport à son prédécesseur.
L'optimiseur MuSGD
La stabilité et la vitesse d'entraînement sont primordiales. YOLO26 introduit l'optimiseur MuSGD, un hybride de Stochastic Gradient Descent (SGD) et de Muon, fortement inspiré par les innovations en matière d'entraînement de LLM provenant de Kimi K2 de Moonshot AI. Cet optimiseur apporte la stabilité de l'entraînement des modèles de langage à la vision par ordinateur, garantissant une convergence plus rapide et réduisant l'empreinte mémoire pendant l'entraînement par rapport aux lourdes alternatives de type Transformer.
ProgLoss et STAL
Pour les chercheurs travaillant avec de l'imagerie aérienne ou des applications de drones, la détection de minuscules caractéristiques est un défi historique. YOLO26 introduit ProgLoss combiné à STAL (Scale-Targeted Attention Loss), offrant des améliorations notables dans la reconnaissance de petits objets par rapport à YOLO11.
Comparaison des performances et des métriques
En comparant les modèles en tête-à-tête, YOLO26 démontre une supériorité claire en termes de précision et d'efficacité sur les appareils en périphérie, tout en maintenant les besoins en mémoire incroyablement faibles caractéristiques de l'écosystème Ultralytics.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Note : Le modèle YOLO26 nano (YOLO26n) présente une amélioration d'environ 31 % de la vitesse CPU par rapport à YOLO11n (38,9 ms contre 56,1 ms), soulignant sa philosophie de conception axée sur la périphérie.
Polyvalence à travers les tâches de vision par ordinateur
Les deux modèles bénéficient de l'écosystème Ultralytics hautement maintenu, offrant une facilité d'utilisation inégalée grâce à une API Python unifiée. Ce ne sont pas seulement des détecteurs d'objets ; ce sont des moteurs multi-tâches. Cependant, YOLO26 intègre plusieurs avancées spécifiques aux tâches :
- Segmentation d'instance : YOLO26 utilise une perte de segmentation sémantique raffinée et un prototypage multi-échelle, générant des frontières de masque plus nettes que YOLO11. En savoir plus sur les workflows de segmentation.
- Estimation de pose : En intégrant l'estimation de log-vraisemblance résiduelle (RLE), YOLO26 améliore considérablement la précision des points clés dans les poses humaines complexes. Découvre les capacités d'estimation de pose.
- Boîtes englobantes orientées (OBB) : Une fonction de perte d'angle spécialisée résout les problèmes historiques de discontinuité des frontières, rendant YOLO26 exceptionnellement fiable pour la détection d'objets pivotés dans les flux satellites. Lis à propos des tâches OBB.
- Classification d'images : Les deux modèles gèrent efficacement la classification à grande vitesse, YOLO26 offrant des améliorations marginales de la précision top-1 sur ImageNet.
Exemple de code pour l'entraînement et l'inférence
Ultralytics est célèbre pour son expérience développeur. Entraîner un modèle SOTA ou exécuter un script d'inférence ne prend que quelques lignes de code, minimisant le code standard et maximisant la productivité. De plus, l'entraînement des modèles YOLO nécessite beaucoup moins de mémoire CUDA que les grands réseaux Transformer.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()Cas d'utilisation idéaux et stratégies de déploiement
Choisir entre YOLO26 et YOLO11 dépend entièrement des contraintes de ton environnement de production.
Quand déployer YOLO26
YOLO26 est le choix définitif pour les projets modernes et nouveaux. Il est spécifiquement conçu pour :
- Informatique en périphérie et IoT : Ses performances CPU stupéfiantes et la suppression de la DFL en font le roi des appareils comme Raspberry Pi, les NPU Coral et les processeurs mobiles.
- Analyse par drone et aérienne : L'intégration de ProgLoss + STAL le rend particulièrement capable de suivre des objets minuscules et rapides à travers des paysages étendus.
- Applications critiques en latence : En robotique autonome ou dans le contrôle qualité industriel, la conception sans NMS garantit une latence déterministe sans pics de post-traitement inattendus.
Quand conserver YOLO11
Bien que YOLO26 soit supérieur, YOLO11 reste un modèle incroyablement capable. Tu pourrais t'en tenir à YOLO11 si :
- Pipelines hérités : Ton infrastructure de déploiement C++ existante est étroitement couplée aux sorties spécifiques basées sur des ancres et à la logique NMS des architectures plus anciennes.
- Bases de référence académiques : Tu publies des recherches et as besoin d'une norme reconnue de 2024 pour comparer tes nouveaux algorithmes.
La puissance de l'écosystème Ultralytics
Peu importe si tu déploies YOLO11 ou YOLO26, utiliser les modèles Ultralytics signifie puiser dans un écosystème bien entretenu avec des mises à jour fréquentes et un vaste support communautaire.
Pour les équipes d'entreprise, la plateforme Ultralytics fournit une solution de bout en bout pour l'annotation de données, l'entraînement de modèles et le déploiement cloud transparent. De l'exportation de tes poids entraînés vers CoreML ou TensorRT, à la configuration de l'optimisation avancée des hyperparamètres, les outils fournis garantissent que ton cycle de vie IA est aussi rationalisé que possible.