Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 vs YOLO26 : L'évolution de l'IA de vision de nouvelle génération#

L'évolution rapide de la vision par ordinateur repousse continuellement les limites de la vitesse, de la précision et de l'efficacité du déploiement. Dans le domaine de la détection d'objets en temps réel, Ultralytics établit systématiquement la norme. Cette comparaison technique explore la transition du modèle YOLO11, qui a fait ses preuves, au modèle YOLO26, à la pointe de la technologie, en analysant leurs architectures, leurs mesures de performance et leurs scénarios de déploiement idéaux.

Que tu développes des systèmes de livraison par drone ou que tu optimises un pipeline de fabrication intelligente à l'échelle mondiale, comprendre les nuances entre ces deux modèles t'aidera à concevoir des solutions d'IA robustes et pérennes.

Link to this sectionLignée et écosystème des modèles#

Les deux modèles bénéficient de l'écosystème complet Ultralytics, caractérisé par son API intuitive, sa maintenance continue et une communauté dynamique. Ils offrent une polyvalence inégalée, prenant naturellement en charge le détection d'objets, la segmentation d'instance, la classification d'images, l'estimation de pose et les tâches de boîtes englobantes orientées (OBB) immédiatement.

Link to this sectionYOLO11 : La norme établie#

Lancé fin 2024, YOLO11 a perfectionné les avancées des générations précédentes, consolidant sa position de cheval de bataille fiable pour les environnements de production.

En savoir plus sur YOLO11

Link to this sectionYOLO26 : La nouvelle frontière#

Introduit début 2026, YOLO26 représente un changement de paradigme dans l'informatique de pointe (edge computing) et l'architecture de bout en bout, offrant des améliorations significatives en termes de vitesse de traitement et de facilité d'intégration.

En savoir plus sur YOLO26

Gestion des données et des déploiements

YOLO11 et YOLO26 sont entièrement intégrés à la plateforme Ultralytics, offrant des workflows fluides sans code pour l'annotation de jeux de données, l'entraînement dans le cloud et la surveillance de flotte.

Link to this sectionInnovations architecturales#

Alors que YOLO11 s'appuie sur des méthodes de post-traitement traditionnelles qui alimentent la vision par ordinateur depuis des années, YOLO26 introduit plusieurs percées structurelles conçues pour éliminer les goulots d'étranglement.

Link to this sectionConception de bout en bout sans NMS#

L'une des améliorations les plus significatives de YOLO26 est son architecture nativement de bout en bout. Elle élimine le post-traitement NMS (Non-Maximum Suppression), un concept initié par YOLOv10. L'évitement du NMS simplifie considérablement le pipeline de déploiement et garantit une latence constante, ce qui est essentiel pour les applications en temps réel comme les algorithmes de conduite autonome.

Link to this sectionSuppression du DFL pour l'optimisation en périphérie#

YOLO26 supprime le DFL (Distribution Focal Loss). Bien que le DFL fût utile dans YOLO11 pour la localisation précise, sa suppression simplifie le graphe d'exportation du réseau. Cette modification garantit une compatibilité accrue avec le matériel à faible consommation, faisant de YOLO26 une solution extrêmement performante sur des appareils en périphérie tels que le Raspberry Pi ou le NVIDIA Jetson.

Link to this sectionOptimiseur MuSGD#

S'inspirant des mécanismes d'entraînement des grands modèles de langage (LLM), plus précisément de Kimi K2 de Moonshot AI, YOLO26 utilise l'optimiseur révolutionnaire MuSGD. Ce mélange de Stochastic Gradient Descent (SGD) et de Muon permet des exécutions d'entraînement remarquablement stables, convergeant beaucoup plus rapidement que les optimiseurs AdamW standard utilisés dans les architectures plus anciennes.

Link to this sectionFonctions de perte avancées#

YOLO26 intègre ProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning). Cette combinaison améliore considérablement la détection d'objets petits et denses. De plus, YOLO26 introduit des améliorations spécifiques aux tâches : un prototype multi-échelle dédié pour la segmentation sémantique, une estimation de log-vraisemblance résiduelle (RLE) pour les estimations complexes de poses humaines, et une perte angulaire spécialisée pour atténuer les problèmes de délimitation dans les tâches OBB.

Link to this sectionComparaison des performances#

Lors de l'évaluation de ces modèles, l'équilibre entre le nombre de paramètres, la complexité computationnelle (FLOPs) et la vitesse dicte le choix du matériel. YOLO26 cible spécifiquement la vitesse d'inférence CPU, atteignant une inférence CPU jusqu'à 43 % plus rapide que son prédécesseur.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Comme démontré, le modèle YOLO26 Nano (YOLO26n) fait un bond significatif en précision tout en réduisant le temps d'inférence CPU de 56,1 ms à 38,9 ms avec ONNX Runtime.

Exportation pour une vitesse maximale

Pour tirer le maximum de performance de ces modèles, exporte-les en utilisant TensorRT sur le matériel NVIDIA ou OpenVINO pour les processeurs Intel. La conception sans NMS de YOLO26 rend ce processus d'exportation plus fluide que jamais.

Link to this sectionCas d'utilisation et applications réelles#

Le choix entre YOLO11 et YOLO26 dépend largement de ton infrastructure spécifique et des objectifs de ton projet.

Link to this sectionEdge Computing et IoT#

Pour les applications contraintes par la puissance et le matériel, telles que la surveillance agricole intelligente via des drones ou des systèmes d'alarme de sécurité locaux, YOLO26 est le champion incontesté. La suppression du DFL et l'augmentation de 43 % de la vitesse CPU te permettent d'exécuter des modèles de vision complexes sur des appareils sans GPU dédiés, tout en maintenant des fréquences d'images élevées.

Link to this sectionCloud et échelle entreprise#

YOLO11 reste un choix exceptionnel pour les solutions d'entreprise où de vastes fermes de serveurs sont déjà optimisées pour ses structures tensorielles. Il convient parfaitement à l'analyse vidéo basée sur le cloud et aux pipelines de traitement multimédia à grande échelle déjà profondément intégrés avec ses formats de sortie spécifiques.

Link to this sectionMulti-tâche complexe#

Si ton projet exige une précision extrême sur de minuscules objets (détection de défauts sur un circuit imprimé ou suivi de véhicules distants dans l'imagerie aérienne, par exemple), l'implémentation ProgLoss + STAL dans YOLO26 offre une amélioration notable du rappel et de la précision pour ces cas critiques.

Link to this sectionEfficacité de l'entraînement et exigences en mémoire#

Un avantage majeur du framework Ultralytics est son empreinte mémoire incroyablement faible pendant l'entraînement. Contrairement aux énormes transformateurs de vision comme RT-DETR ou l'ancien YOLOv8 qui peuvent consommer de grandes quantités de mémoire CUDA, YOLO11 et YOLO26 sont optimisés pour s'entraîner efficacement sur du matériel grand public.

L'intégration de l'optimiseur MuSGD dans YOLO26 améliore encore cela en garantissant que le modèle trouve les poids optimaux plus rapidement, réduisant ainsi les heures de calcul GPU globales et les coûts de cloud computing.

Voici un exemple simple démontrant à quel point il est facile d'entraîner le dernier modèle YOLO26 en utilisant l'API Python native :

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Link to this sectionExploration d'architectures alternatives#

Bien que YOLO26 représente le summum de la détection en temps réel, explorer d'autres modèles dans la documentation Ultralytics peut être bénéfique. Pour les utilisateurs liés à des environnements existants, des architectures antérieures comme YOLOv5 offrent toujours des performances robustes. Pour les capacités de zéro-shot où la définition préalable des classes n'est pas possible, YOLO-World propose une détection à vocabulaire ouvert alimentée par des invites textuelles.

Link to this sectionConclusion#

Le passage de YOLO11 à YOLO26 n'est pas seulement une mise à jour incrémentale ; c'est une réimagination structurelle de la manière dont les modèles de détection d'objets en temps réel fonctionnent en production. En supprimant les étapes complexes de post-traitement et en optimisant pour une exécution orientée périphérie, YOLO26 s'impose comme le choix privilégié des développeurs modernes. Soutenu par l'écosystème robuste Ultralytics et une documentation complète, passer à YOLO26 garantit des déploiements plus rapides, un entraînement stable et une précision SOTA pour pratiquement toute tâche de vision par ordinateur.

Contributeurs

Commentaires