Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs YOLO11#

Le paysage de la vision par ordinateur évolue constamment, de nouvelles architectures repoussant les limites du possible en matière de traitement en temps réel. Pour les développeurs et chercheurs naviguant dans ce domaine en évolution rapide, comprendre les nuances entre les modèles de pointe est crucial. Cette comparaison détaillée explore les différences techniques, les compromis de performance et les cas d'utilisation idéaux pour YOLOv10 et Ultralytics YOLO11, deux frameworks de détection d'objets extrêmement performants.

Bien que les deux modèles obtiennent des résultats remarquables sur les jeux de données de référence, leurs philosophies de conception sous-jacentes et leurs intégrations écosystémiques diffèrent considérablement. En examinant leurs architectures, nous pouvons identifier quelle solution correspond le mieux à tes contraintes de déploiement et à tes objectifs de projet.

Link to this sectionYOLOv10 : Pionnier de la détection de bout en bout sans NMS#

Sorti au printemps 2024, YOLOv10 a introduit une approche novatrice du pipeline traditionnel de détection d'objets en traitant directement la latence associée au post-traitement.

L'innovation phare de YOLOv10 est sa stratégie d'assignations doubles cohérentes, qui permet un entraînement sans NMS. Les détecteurs d'objets traditionnels dépendent fortement du Non-Maximum Suppression (NMS) pour filtrer les prédictions de boîtes englobantes redondantes. En supprimant cette étape, YOLOv10 réalise une détection véritablement de bout en bout, réduisant la latence d'inférence et simplifiant le déploiement sur des accélérateurs matériels tels que les Neural Processing Units (NPUs) où les opérations NMS personnalisées sont notoirement difficiles à optimiser.

En savoir plus sur YOLOv10

Link to this sectionYOLO11 : Polyvalence et performance axées sur l'écosystème#

Lancé plus tard la même année, YOLO11 représente le raffinement continu de la famille de modèles Ultralytics, en se concentrant sur un équilibre optimal entre vitesse, précision et expérience développeur.

YOLO11 est conçu pour la production. Bien qu'il excelle dans la détection standard par boîtes englobantes, sa véritable force réside dans sa polyvalence. Contrairement à YOLOv10, qui se concentre principalement sur la détection d'objets, YOLO11 prend nativement en charge les tâches de segmentation d'instance, estimation de pose, classification d'image et Oriented Bounding Box (OBB) en utilisant une architecture unifiée. Il affiche des besoins en mémoire remarquablement bas pendant l'entraînement, ce qui le rend très accessible pour les équipes travaillant avec des GPUs grand public par rapport à des architectures plus lourdes basées sur les Transformer.

En savoir plus sur YOLO11

Link to this sectionComparaison des performances et des mesures#

Lors de la comparaison côte à côte de ces modèles, il est essentiel d'observer leurs performances à travers différentes variantes d'échelle sur des benchmarks standards comme le COCO dataset.

Le tableau ci-dessous met en évidence les différences de performance. YOLO11 devance fréquemment YOLOv10 en mAP sur la plupart des catégories de taille tout en maintenant des vitesses d'inférence TensorRT très compétitives.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054,4-12.256,9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811,356,9194.9
Accélération matérielle

Pour reproduire ces vitesses d'inférence rapides localement, assure-toi d'exporter tes modèles vers des formats optimisés comme OpenVINO pour les CPU Intel ou TensorRT pour les GPU NVIDIA.

Link to this sectionPlongée architecturale#

Link to this sectionMéthodologie d'entraînement et efficacité#

L'architecture de YOLOv10 met l'accent sur la réduction de la redondance computationnelle. En optimisant les conceptions du backbone et du neck à l'aide d'une stratégie globale axée sur l'efficacité et la précision, les auteurs de l'université Tsinghua ont réussi à réduire significativement le nombre de paramètres dans les modèles de taille moyenne (comme YOLOv10m) par rapport aux itérations précédentes.

Cependant, l'Efficacité de l'entraînement est une marque majeure des modèles Ultralytics. YOLO11 utilise le package Python ultralytics hautement raffiné, qui abstrait le réglage des hyperparamètres complexe. Ce framework gère automatiquement les augmentations de données avancées, la planification du taux d'apprentissage et l'entraînement distribué multi-GPU dès la sortie de la boîte. L'architecture de YOLO11 présente également un excellent flux de gradient, ce qui entraîne une convergence plus rapide et une utilisation plus faible de la VRAM pendant la phase d'entraînement.

Link to this sectionFacilité d'utilisation et avantage de l'écosystème#

Un facteur critique pour l'adoption en entreprise est un écosystème bien entretenu. Les dépôts de recherche, bien que révolutionnaires, deviennent souvent dormants après la publication initiale de l'article. L'écosystème Ultralytics, qui soutient YOLO11, offre une expérience développeur fluide et de bout en bout.

S'intégrant parfaitement avec des outils comme Weights & Biases pour le suivi des expériences et Roboflow pour la gestion des jeux de données, YOLO11 accélère le passage du prototype à la production. La Facilité d'utilisation est évidente dans l'API rationalisée, permettant aux développeurs d'entraîner et d'exporter des modèles avec seulement quelques lignes de code.

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")

# Export to ONNX format for deployment flexibility
model.export(format="onnx")

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLOv10 et YOLO11 dépend de tes besoins spécifiques en matière de projet, de tes contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOv10#

YOLOv10 est un choix solide pour :

  • Détection temps réel sans NMS : Applications bénéficiant d'une détection de bout en bout sans NMS (Non-Maximum Suppression), ce qui réduit la complexité du déploiement.
  • Compromis vitesse-précision équilibré : Projets nécessitant un bon équilibre entre la vitesse d'inférence et la précision de détection pour différentes tailles de modèles.
  • Applications à latence constante : Scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, comme dans la robotique ou les systèmes autonomes.

Link to this sectionQuand choisir YOLO11#

YOLO11 est recommandé pour :

  • Déploiement en production en périphérie : Applications commerciales sur des appareils comme Raspberry Pi ou NVIDIA Jetson où la fiabilité et la maintenance active sont primordiales.
  • Applications de vision multi-tâches : Projets nécessitant la détection, la segmentation, l'estimation de pose et l'OBB au sein d'un cadre unifié unique.
  • Prototypage et déploiement rapides : Équipes qui ont besoin de passer rapidement de la collecte de données à la production en utilisant l'API Python Ultralytics simplifiée.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionExplorer d'autres architectures#

Bien que YOLOv10 et YOLO11 soient d'excellents choix, ton cas d'utilisation spécifique pourrait bénéficier d'autres architectures disponibles dans la documentation. Pour le raisonnement basé sur les séquences, les modèles Transformer comme RT-DETR offrent une grande précision, bien qu'ils exigent généralement des besoins en mémoire plus élevés. Inversement, si tu as besoin de capacités zero-shot pour identifier de nouvelles classes sans réentraînement, YOLO-World propose une approche à vocabulaire ouvert pilotée par des invites en langage naturel.

Link to this sectionLa prochaine génération : YOLO26#

Pour les équipes recherchant l'état de l'art absolu, le récemment publié Ultralytics YOLO26 combine les meilleures fonctionnalités des deux modèles discutés ci-dessus. Sorti en janvier 2026, YOLO26 est la recommandation ultime pour les scénarios de déploiement modernes.

S'appuyant sur les fondations de ses prédécesseurs, YOLO26 intègre nativement une Conception End-to-End sans NMS, éliminant efficacement les goulots d'étranglement de post-traitement que YOLOv10 a abordés en premier, mais en le faisant au sein du robuste framework Ultralytics. De plus, YOLO26 propose la suppression du DFL (Distribution Focal Loss), ce qui simplifie radicalement les graphiques d'exportation de modèles et améliore la compatibilité avec les appareils IoT de périphérie et à faible consommation.

La stabilité de l'entraînement a également connu un saut générationnel avec l'introduction de l'optimiseur MuSGD, une approche hybride inspirée des méthodologies d'entraînement des LLM qui garantit une convergence incroyablement rapide. Associé à des fonctions de perte avancées comme ProgLoss + STAL, YOLO26 offre des améliorations notables dans la reconnaissance des petits objets. Pour un déploiement sur des appareils de périphérie standards, ces raffinements architecturaux se traduisent par une Inférence CPU jusqu'à 43 % plus rapide, faisant de YOLO26 un choix inégalé pour toutes les tâches de vision par ordinateur.

Commentaires