Link to this sectionYOLO11 contre YOLOv10#
Le paysage de la vision par ordinateur en temps réel évolue constamment, avec de nouvelles architectures repoussant les limites de ce qui est possible sur les appareils en périphérie (edge) comme sur l'infrastructure cloud. Dans cette analyse technique détaillée, nous explorons les nuances entre deux modèles pivots du domaine : Ultralytics YOLO11 et YOLOv10. Tous deux représentent des avancées significatives dans les capacités de détection d'objets, tout en adoptant des philosophies architecturales fondamentalement différentes pour atteindre leurs performances.
Link to this sectionDécryptage de l'architecture YOLO11#
Détails sur YOLO11 :
- Auteurs : Glenn Jocher et Jing Qiu
- Organisation : Ultralytics
- Date : 2024-09-27
- GitHub : https://github.com/ultralytics/ultralytics
- Docs : https://docs.ultralytics.com/models/yolo11/
Présenté comme un outil polyvalent et puissant, YOLO11 s'appuie sur des années de recherche fondamentale en vision par ordinateur et IA. La philosophie de conception centrale de YOLO11 tourne autour de la richesse des fonctionnalités et d'une polyvalence extrême pour de multiples tâches de vision par ordinateur.
L'une des améliorations notables de YOLO11 est l'implémentation du Bloc C3k2. Ce module de goulot d'étranglement raffiné optimise le flux de gradient à travers le réseau, améliorant considérablement l'efficacité des paramètres tout en maintenant une précision élevée. De plus, YOLO11 utilise un mécanisme d'attention spatiale amélioré, crucial pour identifier les objets petits ou partiellement masqués. Cela en fait un choix exceptionnel pour les cas d'utilisation en imagerie aérienne et l'analyse détaillée d'imagerie médicale.
YOLO11 utilise une conception sans ancres (anchor-free) qui minimise la complexité du réglage des hyperparamètres, permettant une généralisation robuste sur une vaste gamme de jeux de données personnalisés. En outre, les besoins en mémoire pendant l'entraînement sont nettement inférieurs à ceux des architectures basées sur les Transformers, permettant aux chercheurs d'entraîner des modèles larges efficacement sur du matériel grand public standard.
Link to this sectionExplorer l'architecture YOLOv10#
Détails sur YOLOv10 :
- Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
- Organisation : Université Tsinghua
- Date : 23/05/2024
- Arxiv : https://arxiv.org/abs/2405.14458
- GitHub : https://github.com/THU-MIG/yolov10
- Docs : https://docs.ultralytics.com/models/yolov10/
Développé par des chercheurs de l'Université Tsinghua, YOLOv10 a fait sensation en tant que pionnier du "de bout en bout" (end-to-end) dans la famille YOLO. La marque de fabrique de YOLOv10 est sa méthodologie d'entraînement sans NMS (NMS-Free). En utilisant des assignations doubles cohérentes pendant la phase d'entraînement, le modèle prédit naturellement exactement une boîte englobante (bbox) par objet. Cette avancée élimine complètement le besoin de Non-Maximum Suppression (NMS) lors de l'inférence, une étape de post-traitement qui introduisait historiquement des goulots d'étranglement de latence dans les pipelines de déploiement.
L'architecture introduit également une stratégie de conception holistique axée sur l'efficacité et la précision. Elle intègre un sous-échantillonnage découplé espace-canal et des conceptions de blocs guidées par le rang qui réduisent sélectivement la redondance dans les étapes du réseau. Il en résulte moins de FLOPs et une charge de calcul réduite sans sacrifier significativement la précision moyenne (mAP). Pour les applications en temps réel où chaque milliseconde compte, la suppression du NMS fournit un graphe d'inférence déterministe très adapté aux appareils d'IA en périphérie.
Link to this sectionMétriques de performance et benchmarks#
Lors de l'évaluation de ces deux modèles, nous examinons l'équilibre entre précision, nombre de paramètres et vitesse. Le tableau suivant montre comment ils se comparent à travers diverses échelles sur le jeu de données COCO.
| Modèle | taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11,3 | 56,9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54,4 | - | 12.2 | 56,9 | 160.4 |
Comme observé dans les mesures de performance YOLO, YOLO11 obtient généralement des scores mAP légèrement plus élevés sur ses variantes, en particulier dans les modèles plus grands. La conception sans NMS de YOLOv10 garantit des temps d'inférence de bout en bout très stables, mais YOLO11 parvient toujours à un débit exceptionnel lorsqu'il est optimisé avec TensorRT sur du matériel NVIDIA.
Lorsque tu prépares tes modèles pour le déploiement, l'exportation vers des formats optimisés est cruciale. YOLO11 et YOLOv10 peuvent tous deux être exportés de manière transparente vers des formats comme ONNX et TensorRT en utilisant le framework Ultralytics. Consulte notre guide sur les options de déploiement de modèles pour des instructions étape par étape.
Link to this sectionL'avantage de l'écosystème Ultralytics#
Bien que les mesures de performance autonomes soient importantes, le framework environnant dicte le succès pratique d'un projet d'apprentissage automatique. C'est là que YOLO11, en tant que citoyen natif de l'écosystème Ultralytics, brille vraiment.
La plateforme Ultralytics offre une expérience utilisateur incroyablement simplifiée. Avec une API Python simple et unifiée, les développeurs peuvent gérer des tâches au-delà des simples boîtes englobantes. YOLO11 prend en charge nativement la segmentation d'instances, l'estimation de pose, la classification d'images et la détection par Oriented Bounding Box (OBB) dès sa sortie. Cette immense polyvalence fait souvent défaut dans les dépôts de recherche spécialisés.
De plus, l'écosystème est soutenu par une documentation étendue et un support communautaire actif. Les intégrations avec des outils comme Weights & Biases pour le suivi des expériences, et OpenVINO pour l'optimisation sur matériel Intel, sont intégrées directement dans la bibliothèque. L'entraînement d'un modèle nécessite un minimum de code boilerplate et bénéficie de processus d'entraînement hautement efficaces qui nécessitent moins de mémoire CUDA que les modèles lourds de type Transformer comme RT-DETR.
Link to this sectionExemple de code pratique#
L'entraînement et l'exécution d'inférences avec Ultralytics sont conçus pour être aussi intuitifs que possible. L'API identique gère YOLO11 et YOLOv10 sans effort.
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()Link to this sectionCas d'utilisation et recommandations#
Choisir entre YOLO11 et YOLOv10 dépend de tes besoins spécifiques de projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.
Link to this sectionQuand choisir YOLO11#
YOLO11 est un choix solide pour :
- Déploiement en production en périphérie : Applications commerciales sur des appareils comme Raspberry Pi ou NVIDIA Jetson où la fiabilité et la maintenance active sont primordiales.
- Applications de vision multi-tâches : Projets nécessitant la détection, la segmentation, l'estimation de pose et l'OBB au sein d'un cadre unifié unique.
- Prototypage et déploiement rapides : Équipes qui ont besoin de passer rapidement de la collecte de données à la production en utilisant l'API Python Ultralytics simplifiée.
Link to this sectionQuand choisir YOLOv10#
YOLOv10 est recommandé pour :
- Détection temps réel sans NMS : Applications bénéficiant d'une détection de bout en bout sans NMS (Non-Maximum Suppression), ce qui réduit la complexité du déploiement.
- Compromis vitesse-précision équilibré : Projets nécessitant un bon équilibre entre la vitesse d'inférence et la précision de détection pour différentes tailles de modèles.
- Applications à latence constante : Scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, comme dans la robotique ou les systèmes autonomes.
Link to this sectionQuand choisir Ultralytics (YOLO26)#
Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :
- Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
- Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
- Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.
Link to this sectionLa prochaine génération : YOLO26#
Alors que YOLOv10 a introduit le paradigme révolutionnaire sans NMS et que YOLO11 a perfectionné la polyvalence multi-tâches, le domaine de l'IA évolue rapidement. Pour les développeurs qui lancent de nouveaux déploiements en production aujourd'hui, nous recommandons vivement d'explorer Ultralytics YOLO26.
Publié en janvier 2026, YOLO26 fusionne le meilleur des deux mondes. Il adopte nativement la Conception de bout en bout sans NMS initiée par YOLOv10, simplifiant radicalement le pipeline de déploiement et garantissant une latence constante. De plus, YOLO26 intègre des optimisations spécialisées pour le calcul en périphérie (edge computing). En exécutant la Suppression de DFL (en supprimant la Distribution Focal Loss), l'architecture garantit une exportabilité plus facile et atteint une inférence CPU jusqu'à 43 % plus rapide par rapport aux anciens modèles, ce qui en fait le choix privilégié pour les appareils IoT à faible consommation et les applications mobiles.
YOLO26 apporte également la stabilité de l'entraînement des modèles de langage (LLM) à la vision par ordinateur grâce à l'innovant Optimiseur MuSGD, un hybride inspiré par la recherche de pointe en IA. Associé aux fonctions de perte ProgLoss + STAL, YOLO26 offre une précision inégalée sur les petits objets, ce qui est essentiel pour la détection vidéo du trafic et l'automatisation robotique complexe.
Link to this sectionConclusion#
Choisir le bon modèle de vision dépend de tes contraintes opérationnelles spécifiques. YOLOv10 demeure une étape importante dans le milieu universitaire, prouvant que le NMS peut être efficacement éliminé du pipeline de détection. Cependant, pour un équilibre supérieur entre performance, polyvalence complète des tâches et outils de déploiement transparents, YOLO11 offre une solution robuste, prête pour l'entreprise.
Pour les ingénieurs qui recherchent le nec plus ultra — combinant simplicité de bout en bout et performances fulgurantes en périphérie — la migration vers le dernier YOLO26 est la recommandation ultime. En exploitant la plateforme Ultralytics complète, tu t'assures que tes projets sont construits sur une base bien maintenue, hautement efficace et pérenne.