Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOX#

L'évolution de la vision par ordinateur a été marquée par des avancées architecturales significatives. En 2021, YOLOX a introduit un paradigme sans ancres très influent qui a comblé le fossé entre la recherche universitaire et l'application industrielle. En 2026, le paysage a été redéfini par Ultralytics YOLO, notamment avec la sortie de YOLO26. Cette comparaison complète explore comment YOLO26 s'appuie sur des innovations historiques pour offrir des performances, une polyvalence et une facilité d'utilisation inégalées.

Link to this sectionAperçus des modèles#

Comprendre les origines et les philosophies fondamentales de ces modèles est essentiel pour prendre des décisions de déploiement éclairées.

Link to this sectionDétails de YOLO26#

En savoir plus sur YOLO26

YOLO26 représente le summum de l'ingénierie IA moderne, offrant une conception nativement de bout en bout qui élimine les goulots d'étranglement complexes liés au post-traitement. Il est fortement optimisé pour les déploiements sur le cloud et en périphérie (edge), avec un écosystème qui prend en charge diverses tâches de manière transparente.

Link to this sectionDétails de YOLOX#

En savoir plus sur YOLOX

YOLOX a constitué une avancée majeure, introduisant une tête découplée et une architecture sans ancres, parallèlement à la stratégie d'assignation d'étiquettes SimOTA. Il offrait un excellent équilibre entre vitesse et précision au moment de sa sortie, ce qui en a fait un choix populaire pour de nombreux systèmes existants.

Link to this sectionInnovations architecturales#

Les différences entre YOLO26 et YOLOX mettent en évidence cinq années d'innovation constante dans la conception de l'apprentissage profond.

Alors que YOLOX a défendu l'approche sans ancres, il reposait encore fortement sur la suppression non maximale (NMS) traditionnelle pour filtrer les boîtes englobantes redondantes. YOLO26 introduit une conception de bout en bout sans NMS. Cette percée, initiée pour la première fois dans YOLOv10, élimine complètement le post-traitement NMS, ce qui permet des pipelines de déploiement plus rapides et plus simples avec une variance de latence nettement inférieure.

De plus, YOLO26 propose la suppression de DFL. En supprimant la perte focale de distribution (Distribution Focal Loss), le processus d'exportation du modèle est considérablement simplifié, assurant une compatibilité exceptionnelle avec les appareils de périphérie et le matériel à faible consommation. Combiné aux optimisations architecturales du modèle, YOLO26 atteint jusqu'à 43 % d'inférence CPU plus rapide par rapport à ses prédécesseurs, ce qui en fait un outil puissant pour les environnements dépourvus de GPU dédiés.

La stabilité de l'entraînement est un autre différenciateur critique. YOLO26 utilise le nouvel optimiseur MuSGD, un hybride de SGD et de Muon inspiré des innovations en matière d'entraînement de grands modèles de langage provenant de Moonshot AI. Cet optimiseur apporte la stabilité d'entraînement des grands modèles de langage à la vision par ordinateur, facilitant une convergence plus rapide.

Fonctions de perte avancées

YOLO26 utilise ProgLoss + STAL, des fonctions de perte spécialisées qui apportent des améliorations notables dans la reconnaissance de petits objets. C'est crucial pour des tâches complexes telles que le traitement de l'imagerie aérienne et l'analyse d'environnements denses.

Link to this sectionPerformances et benchmarks#

En comparant ces modèles face à face sur le jeu de données COCO, la supériorité de YOLO26 en termes de précision et d'efficacité devient évidente. Les modèles Ultralytics offrent systématiquement des besoins en mémoire plus faibles pendant l'entraînement et des vitesses d'inférence plus rapides.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040,938.91.72,45,4
YOLO26s64048,687.22.59,520,7
YOLO26m64053,1220.04.720,468,2
YOLO26l64055,0286.26.224,886,4
YOLO26x64057.5525.811.855,7193,9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Note : Le modèle YOLO26x atteint un mAP impressionnant de 57,5 tout en nécessitant nettement moins de paramètres (55,7 M) que le modèle YOLOXx (99,1 M), soulignant l'incroyable efficacité paramétrique de l'architecture Ultralytics.

Link to this sectionÉcosystème et facilité d'utilisation#

L'un des avantages les plus importants du choix de YOLO26 est l'écosystème bien entretenu fourni par Ultralytics. Alors que YOLOX nécessite de naviguer dans des bases de code de recherche complexes et des configurations d'environnement manuelles, Ultralytics offre une expérience développeur simplifiée et « de zéro à héros ».

En utilisant l'API Python unifiée, tu peux facilement basculer entre des tâches telles que la détection d'objets, la segmentation d'instances, la classification d'images et l' estimation de pose. YOLOX, à l'inverse, est strictement limité à la détection par boîte englobante.

Link to this sectionExemple d'entraînement#

Entraîner un modèle sur un jeu de données personnalisé avec Ultralytics est remarquablement efficace. Le pipeline d'entraînement minimise l'utilisation de la mémoire CUDA, permettant des tailles de lots plus grandes même sur du matériel grand public, ce qui contraste fortement avec les anciennes architectures ou les modèles de transformateurs lourds.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

La plateforme Ultralytics améliore encore ce flux de travail en offrant l'entraînement dans le cloud, l'annotation automatique des jeux de données et des options de déploiement en un clic. C'est un outil indispensable pour les équipes qui cherchent à passer rapidement du prototypage à la production.

Link to this sectionCas d'utilisation idéaux et applications réelles#

Choisir le bon modèle détermine le succès de ton déploiement dans le monde réel.

Link to this sectionEdge AI et IoT#

Pour les applications nécessitant un traitement local sur du matériel limité, comme les systèmes d'alarme de sécurité intelligents ou les capteurs environnementaux distants, YOLO26 est le choix définitif. Son architecture sans NMS et son exécution CPU 43 % plus rapide signifient qu'il fonctionne sans problème sur des appareils comme le Raspberry Pi sans contournements de quantification complexes.

Link to this sectionRobotique autonome#

La robotique exige une grande précision et une faible latence. Les capacités d' estimation de pose de YOLO26, renforcées par l'estimation de log-vraisemblance résiduelle (RLE), permettent aux robots de comprendre la cinématique humaine en temps réel. L'absence de détection native de points clés dans YOLOX le rend inadapté à de telles tâches avancées d'interaction homme-robot.

Link to this sectionInspection aérienne et à haute altitude#

Lors de l'inspection d'infrastructures par drone, la détection de défauts infimes est primordiale. Les fonctions ProgLoss et STAL dans YOLO26 améliorent considérablement le rappel sur les petits objets. De plus, YOLO26 prend nativement en charge les boîtes englobantes orientées (OBB), complétées par une perte d'angle spécialisée pour résoudre les problèmes de limites, ce qui le rend parfait pour l'imagerie satellite et aérienne où les objets sont arbitrairement orientés.

Link to this sectionDéploiements hérités#

YOLOX peut encore trouver une utilité dans des environnements hérités où les pipelines de déploiement C++ existants ont été explicitement construits autour de ses sorties de tête découplées spécifiques en 2021. Cependant, pour tout nouveau projet, la migration vers l'écosystème Ultralytics est fortement recommandée afin de tirer parti des gains de performance modernes et du soutien continu de la communauté.

Link to this sectionExplorer d'autres modèles#

Bien que YOLO26 représente l'état actuel de l'art, l'écosystème Ultralytics offre une variété de modèles adaptés à des besoins spécifiques. Pour les développeurs intéressés par les architectures basées sur des transformateurs, RT-DETR propose une approche alternative à la détection de bout en bout. De plus, YOLO11 reste une option robuste et hautement testée pour les environnements de production nécessitant des benchmarks historiques approfondis.

En résumé, la transition de YOLOX à YOLO26 illustre l'avancement rapide du domaine. En combinant une API intuitive, un ensemble de fonctionnalités polyvalent et une efficacité inégalée, YOLO26 s'impose comme le choix privilégié pour les chercheurs et les développeurs du monde entier.

Contributeurs

Commentaires