Ultralytics YOLO11

Présentation

YOLO11 a été publié par Ultralytics le 10 septembre 2024, offrant une précision, une vitesse et une efficacité excellentes. En s'appuyant sur les avancées impressionnantes des versions précédentes de YOLO, YOLO11 introduit des améliorations significatives dans l'architecture et les méthodes d'entraînement, ce qui en fait un choix polyvalent pour une large gamme de tâches de vision par ordinateur. Pour découvrir le dernier modèle Ultralytics avec une inférence de bout en bout sans NMS et un déploiement optimisé en périphérie, consulte YOLO26.

Graphiques de comparaison d'Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Essaie sur la plateforme Ultralytics

Explore et exécute les modèles YOLO11 directement sur la plateforme Ultralytics.

Fonctionnalités clés

  • Extraction de caractéristiques améliorée : YOLO11 utilise une architecture de backbone et de neck améliorée, qui renforce les capacités d'extraction de caractéristiques pour une détection d'objets plus précise et une meilleure performance sur les tâches complexes.
  • Optimisé pour l'efficacité et la vitesse : YOLO11 introduit des designs architecturaux raffinés et des pipelines d'entraînement optimisés, offrant des vitesses de traitement plus rapides tout en maintenant un équilibre optimal entre précision et performance.
  • Plus grande précision avec moins de paramètres : Grâce aux avancées dans la conception des modèles, YOLO11m atteint une précision moyenne (mAP) plus élevée sur le jeu de données COCO tout en utilisant 22 % de paramètres en moins que YOLOv8m, ce qui le rend efficace sur le plan computationnel sans compromettre la précision.
  • Adaptabilité à travers les environnements : YOLO11 peut être déployé de manière transparente dans divers environnements, y compris les appareils en périphérie (edge devices), les plateformes cloud et les systèmes prenant en charge les GPU NVIDIA, assurant une flexibilité maximale.
  • Large gamme de tâches prises en charge : Qu'il s'agisse de détection d'objets, de segmentation d'instance, de classification d'images, d'estimation de pose ou de détection d'objets orientés (OBB), YOLO11 est conçu pour répondre à un ensemble diversifié de défis en vision par ordinateur.

Tâches et modes pris en charge

YOLO11 s'appuie sur la gamme de modèles polyvalents établie par les précédentes versions d'Ultralytics YOLO, offrant un support amélioré pour diverses tâches de vision par ordinateur :

ModèleNoms de fichiersTâcheInférenceValidationEntraînementExportation
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptDétection
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptSegmentation d'instance
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptPose/Points clés
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptDétection orientée
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptClassification

Ce tableau donne un aperçu des variantes du modèle YOLO11, illustrant leur applicabilité à des tâches spécifiques et leur compatibilité avec des modes opérationnels tels que l'Inférence, la Validation, l'Entraînement et l'Exportation. Cette flexibilité rend YOLO11 adapté à un large éventail d'applications en vision par ordinateur, de la détection en temps réel aux tâches de segmentation complexes.

Mesures de performance

Performance

Consulte les Docs de détection pour des exemples d'utilisation avec ces modèles entraînés sur COCO, qui incluent 80 classes pré-entraînées.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Exemples d'utilisation

Cette section fournit des exemples simples d'entraînement et d'inférence avec YOLO11. Pour une documentation complète sur ces modes et d'autres, consulte les pages de documentation Predict, Train, Val et Export.

Note que l'exemple ci-dessous concerne les modèles YOLO11 Detect pour la détection d'objets. Pour les autres tâches prises en charge, consulte la documentation Segment, Classify, OBB et Pose.

Exemple

Les modèles pré-entraînés PyTorch *.pt ainsi que les fichiers de configuration *.yaml peuvent être passés à la classe YOLO() pour créer une instance de modèle en Python :

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Citations et remerciements

Publication Ultralytics YOLO11

Ultralytics n'a pas publié d'article de recherche formel pour YOLO11 en raison de la nature évolutive rapide des modèles. Nous nous concentrons sur l'avancement de la technologie et sur sa facilité d'utilisation, plutôt que sur la production d'une documentation statique. Pour les informations les plus récentes sur l'architecture, les fonctionnalités et l'utilisation de YOLO, veuillez consulter notre dépôt GitHub et notre documentation.

Si tu utilises YOLO11 ou tout autre logiciel de ce dépôt dans ton travail, merci de le citer en utilisant le format suivant :

Citation
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Veuillez noter que le DOI est en attente et sera ajouté à la citation dès qu'il sera disponible. Les modèles YOLO11 sont fournis sous licence AGPL-3.0 et Entreprise.

FAQ

Quelles sont les améliorations clés de Ultralytics YOLO11 par rapport à YOLOv8 ?

Ultralytics YOLO11 introduit plusieurs avancées significatives par rapport à YOLOv8. Les améliorations clés incluent :

  • Extraction de caractéristiques améliorée : YOLO11 utilise une architecture de backbone et de neck améliorée, renforçant les capacités d'extraction de caractéristiques pour une détection d'objets plus précise.
  • Efficacité et vitesse optimisées : Des conceptions architecturales raffinées et des pipelines d'entraînement optimisés permettent des vitesses de traitement plus rapides tout en maintenant un équilibre entre précision et performance.
  • Plus grande précision avec moins de paramètres : YOLO11m atteint une moyenne de précision (mAP) plus élevée sur le jeu de données COCO avec 22 % de paramètres en moins que YOLOv8m, ce qui le rend efficace sur le plan computationnel sans compromettre la précision.
  • Adaptabilité à travers les environnements : YOLO11 peut être déployé dans divers environnements, y compris les appareils edge, les plateformes cloud et les systèmes prenant en charge les GPU NVIDIA.
  • Large gamme de tâches prises en charge : YOLO11 prend en charge diverses tâches de vision par ordinateur telles que la détection d'objets, la segmentation d'instance, la classification d'images, l'estimation de pose et la détection d'objets orientés (OBB).

Comment entraîner un modèle YOLO11 pour la détection d'objets ?

L'entraînement d'un modèle YOLO11 pour la détection d'objets peut être effectué en utilisant Python ou des commandes CLI. Voici des exemples pour les deux méthodes :

Exemple
from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Pour des instructions plus détaillées, réfère-toi à la documentation Train.

Quelles tâches les modèles YOLO11 peuvent-ils effectuer ?

Les modèles YOLO11 sont polyvalents et prennent en charge une large gamme de tâches de vision par ordinateur, notamment :

  • Détection d'objets : Identifier et localiser des objets dans une image.
  • Segmentation d'instance : Détecter des objets et délimiter leurs frontières.
  • Classification d'images : Catégoriser des images dans des classes prédéfinies.
  • Estimation de pose : Détecter et suivre des points clés sur des corps humains.
  • Détection d'objets orientés (OBB) : Détecter des objets avec rotation pour une plus grande précision.

Pour plus d'informations sur chaque tâche, consulte la documentation Detection, Instance Segmentation, Classification, Pose Estimation et Oriented Detection.

Comment YOLO11 obtient-il une meilleure précision avec moins de paramètres ?

YOLO11 obtient une meilleure précision avec moins de paramètres grâce à des avancées dans la conception du modèle et des techniques d'optimisation. L'architecture améliorée permet une extraction et un traitement efficaces des caractéristiques, aboutissant à une précision moyenne (mAP) plus élevée sur des jeux de données comme COCO tout en utilisant 22 % de paramètres en moins que YOLOv8m. Cela rend YOLO11 efficace sur le plan computationnel sans compromis sur la précision, ce qui le rend adapté au déploiement sur des appareils aux ressources limitées.

YOLO11 peut-il être déployé sur des appareils edge ?

Oui, YOLO11 est conçu pour s'adapter à divers environnements, y compris les appareils edge. Son architecture optimisée et ses capacités de traitement efficaces le rendent adapté au déploiement sur des appareils edge, des plateformes cloud et des systèmes prenant en charge les GPU NVIDIA. Cette flexibilité garantit que YOLO11 peut être utilisé dans diverses applications, de la détection en temps réel sur des appareils mobiles aux tâches complexes de segmentation dans des environnements cloud. Pour plus de détails sur les options de déploiement, consulte la documentation Export.

Commentaires