YOLO11 YOLO26 : l'évolution de la détection d'objets en temps réel

Le paysage de la vision par ordinateur est en constante évolution, chaque nouvelle itération de modèle repoussant les limites en matière de vitesse, de précision et de convivialité. Deux étapes importantes dans cette évolution sont YOLO11 et le révolutionnaire YOLO26. Alors que YOLO11 une norme robuste pour le déploiement en entreprise à la fin de 2024, YOLO26 représente un changement de paradigme avec son architecture native de bout en bout et sa conception CPU.

Ce guide fournit une comparaison technique complète afin d'aider les développeurs, chercheurs et ingénieurs à choisir l'outil adapté à leurs applications spécifiques en matière de vision par ordinateur.

Résumé : principales différences

Bien que les deux modèles reposent sur les principes fondamentaux de la famille YOLO You Only Look Once), leur philosophie architecturale diverge considérablement.

YOLO11: Conçu pour être polyvalent et s'intégrer à l'écosystème. Il s'appuie sur des méthodes de post-traitement traditionnelles telles que la suppression non maximale (NMS), mais offre un cadre très stable et bien pris en charge pour une grande variété de tâches.
YOLO26 : Conçu pour la périphérie et à l'épreuve du temps. Il introduit une conception native de bout en bout NMS, éliminant ainsi les étapes complexes de post-traitement. Il intègre également l'optimiseur innovant MuSGD et est spécialement conçu pour CPU , ce qui le rend jusqu'à 43 % plus rapide sur des appareils tels que le Raspberry Pi.

Analyse détaillée des performances

L'écart de performance entre les générations est souvent mesuré en millisecondes et en points de pourcentage de la précision moyenne (mAP). Le tableau ci-dessous met en évidence les améliorations en termes de vitesse et de précision. Notez la réduction significative du temps CPU pour YOLO26, un indicateur essentiel pour les déploiements d'IA en périphérie.

Modèle	Taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	paramètres ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLO11: la norme polyvalente

YOLO11
Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 27/09/2024
GitHub : Ultralytics

YOLO11 une amélioration majeure dans la YOLO , en mettant l'accent sur l'efficacité de l'extraction des caractéristiques. Il améliorait YOLOv8 en optimisant le bloc C3k2 et en introduisant des améliorations SPPF.

Points forts :

Robustesse éprouvée : largement adopté dans l'industrie, avec de nombreux plugins et une assistance communautaire étendue.
GPU : très efficace sur NVIDIA (T4, A100) grâce à TensorRT, ce qui le rend excellent pour l'inférence basée sur le cloud.
Polyvalence des tâches : performances élevées en matière de détection, de segmentation et d'estimation de la pose.

Faiblesses :

NMS : nécessite un post-traitement de suppression non maximale, ce qui peut introduire une variabilité de latence et compliquer les pipelines de déploiement.
FLOP plus élevés : légèrement plus coûteux en termes de calcul que les architectures les plus récentes.

En savoir plus sur YOLO11

YOLO26 : l'innovateur avant-gardiste

YOLO26
Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 14/01/2026
GitHub : Ultralytics

YOLO26 est une architecture avant-gardiste qui privilégie l'efficacité sur du matériel informatique standard. En supprimant le besoin d'NMS en optimisant les jeux CPU , elle libère des performances en temps réel sur des appareils auparavant considérés comme trop lents pour l'IA moderne.

Principales innovations :

NMS de bout en bout : en prédisant directement les correspondances uniques, YOLO26 élimine le NMS . Cela simplifie CoreML l'exportation vers ONNX ou CoreML .
Suppression du DFL : la suppression du flux de perte focale de distribution rationalise la tête de sortie, améliorant ainsi la compatibilité avec les périphériques à faible consommation d'énergie.
Optimiseur MuSGD : inspiré des techniques d'entraînement des grands modèles linguistiques (LLM) (en particulier Kimi K2 de Moonshot AI), cet optimiseur hybride combine SGD et Muon pour une convergence et une stabilité plus rapides.
ProgLoss + STAL : de nouvelles fonctions de perte améliorent la détection des petits objets, une exigence essentielle pour l'imagerie aérienne et la robotique.

En savoir plus sur YOLO26

Plongée architecturale en profondeur

Le passage de YOLO11 YOLO26 ne concerne pas seulement le nombre de paramètres ; il s'agit d'un changement fondamental dans la manière dont le modèle apprend et prédit.

Méthodologies de formation et efficacité

L'une des caractéristiques remarquables des Ultralytics est leur efficacité en matière de formation. Les deux modèles bénéficient de la Ultralytics intégrée, qui permet une gestion transparente des ensembles de données et une formation dans le cloud.

Cependant, YOLO26 introduit l'optimiseur MuSGD, qui adapte les mises à jour du momentum afin de gérer plus efficacement les paysages de pertes complexes des modèles de vision que AdamW standard AdamW SGD. Il en résulte des modèles qui convergent plus rapidement, ce qui permet d'économiser de précieuses heures GPU et de réduire l'empreinte carbone de l'entraînement.

De plus, YOLO26 utilise des pertes spécifiques à la tâche améliorées :

Segmentation : perte de segmentation sémantique améliorée et modules proto multi-échelles.
Pose : estimation de la vraisemblance logarithmique résiduelle (RLE) pour une localisation plus précise des points clés.
OBB : perte d'angle spécialisée pour résoudre les discontinuités de frontière dans les tâches de boîte englobante orientée.

Besoins en mémoire

YOLO Ultralytics sont réputés pour leur faible empreinte mémoire par rapport aux architectures basées sur des transformateurs telles que RT-DETR ou SAM .

Optimisation de la mémoire

YOLO11 YOLO26 sont tous deux conçus pour être entraînés sur des GPU grand public (par exemple, NVIDIA 3060 ou 4070). Contrairement aux modèles de transformateurs massifs qui nécessitent plus de 24 Go de VRAM, YOLO efficaces peuvent souvent être affinées sur des appareils disposant d'aussi peu que 8 Go de VRAM en utilisant des tailles de lots appropriées.

Cas d'utilisation concrets

Le choix entre YOLO11 YOLO26 dépend souvent de votre matériel de déploiement et des besoins spécifiques de votre application.

Scénarios idéaux pour YOLO11

Services API cloud : lorsque des GPU puissants sont disponibles et que le débit élevé (traitement par lots) est plus important que la latence d'une image unique.
Intégrations existantes : systèmes déjà construits autour de pipelines NMS où il n'est pas possible de modifier la logique de post-traitement.
Analyses à usage général : cartographie thermique dans le commerce de détail ou comptage de clients à l'aide de GPU standard.

Scénarios Idéaux pour YOLO26

IoT et appareils périphériques : exécution de la détection d'objets sur Raspberry Pi, NVIDIA Nano ou des téléphones mobiles. Le CPU de 43 % CPU change la donne dans ce domaine.
Robotique : la variance de latence est fatale pour les boucles de contrôle. La conception NMS garantit des temps d'inférence déterministes, essentiels pour la navigation autonome.
Levés aériens : la fonction ProgLoss améliore considérablement la reconnaissance des petits objets, ce qui rend YOLO26 supérieur pour l'analyse des images filmées par drone.
Systèmes embarqués : appareils dotés d'une puissance de calcul limitée qui ne peuvent pas supporter la charge supplémentaire liée au tri de milliers de boîtes candidates pendant NMS.

Implémentation du code

Les deux modèles partagent la même facilité d'utilisation qui caractérise Ultralytics . Le passage de YOLO11 YOLO26 nécessite uniquement de modifier la chaîne du modèle.

from ultralytics import YOLO

# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display to screen
    result.save(filename="result.jpg")  # Save to disk

Cette API unifiée permet aux développeurs d'expérimenter différentes architectures sans avoir à réécrire l'intégralité de leur base de code.

Conclusion

Ces deux architectures démontrent pourquoi Ultralytics le leader dans le domaine de la vision par ordinateur open source. YOLO11 offre une solution mature, polyvalente et GPU, parfaite pour les centres de données d'entreprise. YOLO26, quant à lui, représente l'avenir de l'IA de pointe, offrant CPU ultra-rapides et un pipeline simplifié de bout en bout qui élimine les goulots d'étranglement traditionnels.

Pour la plupart des nouveaux projets, en particulier ceux impliquant un déploiement en périphérie, des applications mobiles ou la robotique,YOLO26 est le choix recommandé en raison de son rapport vitesse/précision supérieur et de sa conception architecturale moderne.

Autres modèles à explorer

YOLOv10: Le pionnier de l'approche NMS dans la YOLO .
RT-DETR: Détecteur à transformateur offrant une grande précision pour les situations où la vitesse est secondaire.
YOLOv8: un classique très fiable, toujours largement utilisé pour sa vaste bibliothèque de ressources.