Passer au contenu

YOLO11 YOLO: comparaison des détecteurs d'objets de nouvelle génération

Le choix de l'architecture optimale est une étape cruciale dans tout projet de vision par ordinateur. Ce guide technique fournit une comparaison complète entre deux puissants modèles de détection d'objets : Ultralytics YOLO11 et YOLO. Nous nous pencherons sur leurs innovations architecturales, leurs paradigmes d'entraînement et leur applicabilité dans le monde réel afin de vous aider à choisir l'outil le mieux adapté à vos besoins de déploiement.

Aperçus des modèles

Ultralytics YOLO11

Développé par l'équipe d'Ultralytics, YOLO11 représente une itération hautement raffinée de la YOLO , optimisant considérablement à la fois la précision et l'efficacité. Il est conçu pour les chercheurs et les ingénieurs à la recherche d'un écosystème unifié et prêt à l'emploi, allant de la gestion des ensembles de données au déploiement en périphérie.

En savoir plus sur YOLO11

YOLO11 par sa polyvalence. Alors que de nombreux modèles traditionnels se concentrent uniquement sur les boîtes englobantes, YOLO11 prend en charge YOLO11 la détection d'objets, la segmentation d'instances, la classification d'images et l'estimation de poses. Cette capacité multimodale permet aux développeurs de consolider leurs pipelines d'IA visuelle sous un cadre unique et bien entretenu.

DAMO-YOLO

YOLO a été développé par des chercheurs du groupe Alibaba. Il exploite la recherche d'architecture neuronale (NAS) pour découvrir des structures de base hautement efficaces adaptées à l'inférence en temps réel sur les GPU et autres accélérateurs.

En savoir plus sur DAMO-YOLO

La philosophie fondamentale deYOLO autour de la rep-paramétrisation et de la recherche automatisée. En utilisant MAE-NAS (Multi-Objective Evolutionary Neural Architecture Search), les auteurs ont conçu une structure personnalisée qui augmente considérablement les vitesses d'inférence sur du matériel spécialisé. Elle intègre également un cou fortement optimisé appelé Efficient RepGFPN et une structure ZeroHead simplifiée afin de minimiser la latence.

Autres modèles à considérer

Lorsque vous comparez YOLO11 YOLO, pensez à jeter un œil au tout nouveau Ultralytics . Il introduit une inférence native de bout en bout NMS et offre CPU jusqu'à 43 % plus rapides. Vous pouvez également explorer les comparaisons impliquant YOLOX ou YOLOv8.

Comparaison des performances et de l'architecture

Il est essentiel de comprendre les compromis en matière de performances lors du déploiement d'applications d'IA en périphérie. Le tableau ci-dessous présente les indicateurs clés tels que la précision moyenne (mAP), la latence et la taille de calcul.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Plongée architecturale en profondeur

YOLO11 s'appuie sur une infrastructure hautement efficace et conçue sur mesure qui offre un équilibre parfait entre le nombre de paramètres et la capacité de représentation. Il est optimisé pour fonctionner parfaitement sur une large gamme de matériel, excellant de manière native avec une utilisation minimale CUDA pendant l'entraînement et l'inférence. Cela en fait une option idéale pour le matériel grand public standard ou les appareils IoT aux ressources limitées.

À l'inverse, les backbones générés par MAE-NAS YOLO sont finement réglés pour GPU à haut débit. Son Efficient RepGFPN (Generalized Feature Pyramid Network) intègre de manière agressive plusieurs échelles. Cependant, si la paramétrisation rep accélère l'inférence, elle peut compliquer le processus de déploiement si votre pile matérielle ne prend pas explicitement en charge ces opérations.

Facilité d'utilisation et efficacité de la formation

Lorsque l'on tient compte du temps de développement, la facilité d'utilisation d'un modèle devient tout aussi importante que ses performances brutes.

YOLO11 repose largement sur le principe de l'accessibilité pour les développeurs. Le complet ultralytics Le package évite les tâches fastidieuses d'analyse, d'augmentation et de réglage des hyperparamètres des ensembles de données. Exportation des modèles vers des formats de production tels que ONNX, TensorRT, et OpenVINO ne nécessite qu'une seule commande.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

Issu d'un milieu universitaire et de recherche, YOLO présente une courbe d'apprentissage plus raide. Pour atteindre sa précision maximale, il faut souvent recourir à des pipelines complexes de distillation des connaissances, ce qui signifie qu'il faut d'abord former un réseau « enseignant » massif avant de transmettre ces connaissances à un réseau « élève » plus petit. Cela augmente considérablement la charge GPU requise et la durée globale de la formation par rapport aux boucles de formation allégées Ultralytics .

Cas d'utilisation et recommandations

Le choix entre YOLO11 YOLO des exigences spécifiques de votre projet, des contraintes de déploiement et des préférences de votre écosystème.

Quand choisir YOLO11

YOLO11 un excellent choix pour :

  • Déploiement en production : applications commerciales sur des appareils tels que Raspberry Pi ou NVIDIA , où la fiabilité et la maintenance active sont primordiales.
  • Applications de vision multitâches : projets nécessitant la détection, la segmentation, l'estimation de la pose et l'OBB dans un cadre unique et unifié.
  • Prototypage et déploiement rapides : équipes qui doivent passer rapidement de la collecte de données à la production à l'aide de Python Ultralytics simplifiée.

Quand choisir DAMO-YOLO

YOLO recommandé pour :

  • Analyse vidéo à haut débit : traitement de flux vidéo à fréquence d'images élevée surGPU NVIDIA fixe où le débit du lot 1 est la principale métrique.
  • Lignes de fabrication industrielle : scénarios avec des contraintes strictes GPU sur du matériel dédié, tels que le contrôle qualité en temps réel sur les chaînes de montage.
  • Recherche sur la recherche d'architecture neuronale : étude des effets de la recherche automatisée d'architecture (MAE-NAS) et des structures de base reparamétrées efficaces sur les performances de détection.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

  • DéploiementNMS suppressionNMS maximale (NMS: applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par suppression non maximale.
  • EnvironnementsCPU: appareils sans GPU dédiée, où CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : scénarios complexes tels que l'imagerie aérienne par drone ou l'analyse par capteurs IoT, où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Applications et cas d'utilisation réels

Systèmes autonomes et drones

Pour l'imagerie aérienne et les déploiements de drones, YOLO11 offre un équilibre de performances incroyablement favorable. La détection de petits objets est un obstacle majeur dans l'analyse des données issues des drones, mais YOLO11 nativement différentes échelles dès son installation. De plus, grâce à ses faibles besoins en mémoire, les variantes YOLO11 et Small peuvent fonctionner directement sur des processeurs ou des processeurs neuronaux légers intégrés au drone.

Automatisation industrielle et contrôle qualité

Dans les usines intelligentes, la latence est primordiale. Si YOLO offre des vitesses d'inférence robustes sur les GPU de niveau serveur grâce à son cou RepGFPN, son intégration rigide peut s'avérer excessive. YOLO11 constitue YOLO11 une alternative supérieure pour le contrôle qualité automatisé grâce à ses API de suivi simples et à sa capacité à passer de manière transparente de la détection pure à des tâches de bounding box orienté (OBB) si les défauts nécessitent une reconnaissance des limites angulaires.

Santé intelligente et imagerie médicale

Les ensembles de données d'imagerie médicale sont souvent relativement petits, et il est difficile d'éviter le surapprentissage. Les techniques d'augmentation active, combinées aux pipelines d'apprentissage par transfert standard fournis par l'écosystème bien entretenu Ultralytics, aident les cliniciens et les développeurs à déployer de manière fiable des modèles précis de détection des tumeurs. Le vaste soutien de la communauté garantit que les problèmes dans des domaines complexes tels que les soins de santé sont rapidement résolus.

Embrasser l'avenir avec YOLO26

Si vous développez une nouvelle application à partir de zéro, pensez à explorer YOLO26. Lancé début 2026, il utilise un optimiseur MuSGD et des fonctions ProgLoss, offrant une précision exceptionnelle sur les petits objets et fournissant un pipeline complet NMS prêt à l'emploi !

En fin de compte, siYOLO une démonstration puissante de la recherche d'architecture neuronale, YOLO11 et la Ultralytics élargie restent la recommandation définitive pour les tâches de vision par ordinateur dans le monde réel, en privilégiant un déploiement rapide, la facilité d'utilisation pour les développeurs et des performances multimodales de premier ordre.


Commentaires