Passer au contenu

YOLO26 vsYOLO: l'évolution de la détection d'objets en temps réel

Le domaine de la vision par ordinateur évolue rapidement, avec de nouvelles architectures repoussant sans cesse les limites en matière de vitesse et de précision. Deux étapes importantes dans cette évolution sont YOLO, développé par Alibaba Group fin 2022, et YOLO26, le modèle de pointe lancé par Ultralytics 2026.

Alors queYOLO des concepts innovants tels que la recherche d'architecture neuronale (NAS) dans la YOLO , YOLO26 représente un changement de paradigme vers un traitement natif de bout en bout et une conception axée sur la périphérie. Cette comparaison détaillée explore les différences architecturales, les mesures de performance et les réalités de déploiement de ces deux modèles puissants afin d'aider les développeurs à choisir l'outil adapté à leurs besoins en matière de détection d'objets.

Comparaison des métriques de performance

Le tableau suivant compare les performances de YOLO26 à celles deYOLO. Notez les améliorations significatives en termes de vitesse d'inférence, en particulier pour les opérations CPU, qui constituent l'une des caractéristiques principales de l'architecture YOLO26.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics : la nouvelle norme

Lancé en janvier 2026 par Ultralytics, YOLO26 s'appuie sur l'héritage de YOLO11 et YOLOv8, en introduisant des changements radicaux dans le pipeline de détection. Sa philosophie de conception principale vise à éliminer les goulots d'étranglement dans le déploiement et la formation, ce qui en fait le modèle le plus efficace pour les GPU haut de gamme et les appareils périphériques limités.

Innovations clés

  1. Conception NMS de bout en bout : contrairement aux générations précédentes et à ses concurrents tels queYOLO, YOLO26 est nativement de bout en bout. Il élimine le besoin d'un post-traitement par suppression non maximale (NMS). Cela réduit la variance de latence et simplifie les pipelines de déploiement, une approche révolutionnaire lancée pour la première fois dans YOLOv10.
  2. Optimiseur MuSGD : inspiré par les récentes avancées dans la formation des modèles linguistiques à grande échelle (LLM), YOLO26 utilise un hybride de SGD Muon. Cet optimiseur offre une plus grande stabilité pendant la formation et une convergence plus rapide, réduisant ainsi le coût de calcul nécessaire pour atteindre une précision optimale.
  3. Optimisation Edge-First : en supprimant la perte focale de distribution (DFL), l'architecture du modèle est simplifiée pour faciliter l'exportation vers des formats tels que ONNX CoreML. Cela contribue à une vitesse CPU 43 % plus rapide par rapport aux itérations précédentes, ce qui le rend idéal pour les appareils tels que le Raspberry Pi ou les téléphones mobiles.
  4. Détection améliorée des petits objets : l'intégration de ProgLoss et STAL (Scale-Aware Training Adaptive Loss) améliore considérablement les performances sur les petits objets, remédiant ainsi à une faiblesse courante des détecteurs à étape unique.

Déploiement Optimisé

Comme YOLO26 supprime NMS , les modèles exportés sont des réseaux neuronaux purs sans code de post-traitement complexe. Cela facilite considérablement l'intégration dans des environnements C++ ou mobiles et réduit le risque d'erreurs logiques.

Exemple de code

L'expérience utilisateur avec YOLO26 reste cohérente avec le Python Ultralytics simplifié.

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

En savoir plus sur YOLO26

YOLO: le challenger piloté par NAS

Développé par la DAMO Academy d'Alibaba, YOLO a fait sensation en 2022 en exploitant la recherche d'architecture neuronale (NAS) pour concevoir son infrastructure. Plutôt que de créer manuellement la structure du réseau, les auteurs ont utilisé MAE-NAS (méthode des arêtes auxiliaires) pour découvrir automatiquement des architectures efficaces dans le cadre de contraintes de latence spécifiques.

Principales caractéristiques

  • MAE-NAS Backbone : La structure du réseau a été optimisée mathématiquement afin de maximiser le flux d'informations tout en minimisant les coûts de calcul.
  • RepGFPN : un réseau pyramidal efficace qui utilise la reparamétrisation pour améliorer la fusion des caractéristiques à différentes échelles.
  • ZeroHead : une tête de détection légère conçue pour réduire le nombre de paramètres à l'extrémité du réseau.
  • AlignedOTA : stratégie d'attribution d'étiquettes qui aide le modèle à mieux comprendre quelles zones d'ancrage correspondent aux objets réels pendant l'entraînement.

SiYOLO d'excellentes performances pour l'époque, son recours à un pipeline de formation par distillation complexe, dans lequel un modèle enseignant plus grand guide le modèle élève plus petit, rend la formation personnalisée plus gourmande en ressources par rapport aux capacités de « formation à partir de zéro » Ultralytics .

Comparaison Détaillée

Architecture et stabilité de la formation

La différence la plus notable réside dans l'approche d'optimisation.YOLO sur le NAS pour trouver la meilleure structure, ce qui peut donner des FLOP théoriques très efficaces, mais aboutit souvent à des architectures difficiles à modifier ou à déboguer.

YOLO26, à l'inverse, utilise des améliorations architecturales artisanales et intuitives (comme la suppression du DFL et de la tête NMS) renforcées par l'optimiseur MuSGD. Cet optimiseur apporte à la vision par ordinateur la stabilité souvent observée dans les LLM. Pour les développeurs, cela signifie que YOLO26 est moins sensible au réglage des hyperparamètres et converge de manière fiable sur des ensembles de données personnalisés.

Vitesse d'inférence et efficacité des ressources

Alors queYOLO pour GPU à l'aide de TensorRT, YOLO26 adopte une approche plus large. La suppression de DFL et NMS YOLO26 d'exceller sur les CPU, atteignant des vitesses jusqu'à 43 % plus rapides que ses prédécesseurs. Cela est crucial pour les applications dans le domaine de l'analyse commerciale ou des villes intelligentes, où les appareils périphériques peuvent ne pas disposer de GPU dédiés.

De plus, les besoins en mémoire de YOLO26 pendant l'entraînement sont généralement moins importants. Alors queYOLO nécessiteYOLO l'entraînement d'un modèle enseignant lourd pour la distillation afin d'obtenir des résultats optimaux, YOLO26 atteint directement des résultats SOTA, ce qui permet d'économiser un nombre considérable GPU et d'électricité.

Polyvalence et écosystème

L'un des principaux avantages de Ultralytics est sa polyvalence.YOLO avant tout un détecteur d'objets. En revanche, l'architecture YOLO26 prend en charge de manière native un large éventail de tâches de vision par ordinateur, notamment :

Cela permet à une seule équipe de développement d'utiliser une seule API et un seul framework pour plusieurs problèmes distincts, ce qui réduit considérablement la dette technique.

Tableau comparatif : Caractéristiques

FonctionnalitéYOLO26DAMO-YOLO
Date de sortieJanvier 2026Novembre 2022
ArchitectureDe bout en bout, NMSBasé sur NAS, sans ancrage
Post-traitementAucun (résultat du modèle = final)Suppression non maximale (NMS)
OptimiseurMuSGD (SGD muon)SGD AdamW
Pipeline de formationÀ une seule étape, formation complèteDistillation complexe (enseignant-élève)
Tâches prises en chargedetect, segment, Pose, obb, classifyDétection
Optimisation pour l'edgeÉlevé (sans DFL, optimisé pour CPU)Modéré (TensorRT )

Conclusion

Ces deux architectures représentent des moments forts dans l'histoire de la détection d'objets.YOLO la puissance de la recherche automatisée d'architectures et de la reparamétrisation. Cependant, YOLO26 représente l'avenir du déploiement pratique de l'IA.

En éliminant le NMS , en introduisant des optimiseurs de niveau LLM tels que MuSGD et en fournissant une solution unifiée pour la segmentation, la pose et la détection, Ultralytics offre un équilibre supérieur entre performances et facilité d'utilisation. Pour les développeurs qui créent des applications concrètes, de l'automatisation industrielle aux applications mobiles, l'écosystème robuste, la documentation complète et la Ultralytics font de YOLO26 la recommandation évidente.

Pour ceux qui souhaitent effectuer d'autres comparaisons, vous pouvez explorer YOLO11 YOLO ou vous intéresser à des alternatives basées sur les transformateurs telles que RT-DETR.

Auteur et références

YOLO26

DAMO-YOLO

  • Auteurs : Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
  • Organisation : Alibaba Group
  • Date : 2022-11-23
  • Article :arXiv:2211.15444

Commentaires