Link to this sectionJeu de données COCO-Pose#
Le jeu de données COCO-Pose est une version spécialisée du jeu de données COCO (Common Objects in Context), conçue pour les tâches d'estimation de pose. Il exploite les images et les étiquettes COCO Keypoints 2017 pour permettre l'entraînement de modèles comme YOLO pour des tâches d'estimation de pose.

Link to this sectionModèles pré-entraînés COCO-Pose#
| Modèle | taille (pixels) | mAPpose 50-95(e2e) | mAPpose 50(e2e) | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n-pose | 640 | 57.2 | 83.3 | 40.3 ± 0.5 | 1.8 ± 0.0 | 2.9 | 7.5 |
| YOLO26s-pose | 640 | 63.0 | 86.6 | 85.3 ± 0.9 | 2.7 ± 0.0 | 10.4 | 23.9 |
| YOLO26m-pose | 640 | 68.8 | 89.6 | 218.0 ± 1.5 | 5.0 ± 0.1 | 21.5 | 73.1 |
| YOLO26l-pose | 640 | 70.4 | 90.5 | 275.4 ± 2.4 | 6.5 ± 0.1 | 25.9 | 91.3 |
| YOLO26x-pose | 640 | 71.6 | 91.6 | 565.4 ± 3.0 | 12.2 ± 0.2 | 57.6 | 201.7 |
Link to this sectionFonctionnalités clés#
- COCO-Pose s'appuie sur le jeu de données COCO Keypoints 2017 qui contient 200 000 images étiquetées avec des points clés pour des tâches d'estimation de pose.
- Le jeu de données prend en charge 17 points clés pour les silhouettes humaines, facilitant ainsi une estimation de pose détaillée.
- Comme COCO, il fournit des métriques d'évaluation standardisées, incluant l'Object Keypoint Similarity (OKS) pour les tâches d'estimation de pose, ce qui le rend adapté à la comparaison des performances des modèles.
Link to this sectionStructure du jeu de données#
Le jeu de données COCO-Pose est divisé en trois sous-ensembles :
- Train2017 : Ce sous-ensemble contient 56599 images du jeu de données COCO, annotées pour l'entraînement de modèles d'estimation de pose.
- Val2017 : Ce sous-ensemble dispose de 2346 images utilisées à des fins de validation pendant l'entraînement du modèle.
- Test2017 : Ce sous-ensemble se compose d'images utilisées pour tester et évaluer les modèles entraînés. Les annotations de vérité terrain pour ce sous-ensemble ne sont pas accessibles au public, et les résultats sont soumis au COCO evaluation server pour l'évaluation des performances.
Link to this sectionApplications#
Le jeu de données COCO-Pose est spécifiquement utilisé pour l'entraînement et l'évaluation de modèles de deep learning dans des tâches de détection de points clés et d'estimation de pose, comme OpenPose. Le grand nombre d'images annotées du jeu de données et ses métriques d'évaluation standardisées en font une ressource essentielle pour les chercheurs et les praticiens en computer vision focalisés sur l'estimation de pose.
Link to this sectionYAML du jeu de données#
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins du jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données COCO-Pose, le fichier coco-pose.yaml est maintenu à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco-pose.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO 2017 Keypoints dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/pose/coco/
# Example usage: yolo train data=coco-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco-pose ← downloads here (20.1 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco-pose # dataset root dir
train: train2017.txt # train images (relative to 'path') 56599 images
val: val2017.txt # val images (relative to 'path') 2346 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://codalab.lisn.upsaclay.fr/competitions/7403
# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]
# Classes
names:
0: person
# Keypoint names per class
kpt_names:
0:
- nose
- left_eye
- right_eye
- left_ear
- right_ear
- left_shoulder
- right_shoulder
- left_elbow
- right_elbow
- left_wrist
- right_wrist
- left_hip
- right_hip
- left_knee
- right_knee
- left_ankle
- right_ankle
# Download script/URL (optional)
download: |
from pathlib import Path
from ultralytics.utils import ASSETS_URL
from ultralytics.utils.downloads import download
# Download labels
dir = Path(yaml["path"]) # dataset root dir
urls = [f"{ASSETS_URL}/coco2017labels-pose.zip"]
download(urls, dir=dir.parent)
# Download data
urls = [
"http://images.cocodataset.org/zips/train2017.zip", # 19G, 118k images
"http://images.cocodataset.org/zips/val2017.zip", # 1G, 5k images
"http://images.cocodataset.org/zips/test2017.zip", # 7G, 41k images (optional)
]
download(urls, dir=dir / "images", threads=3)Link to this sectionUtilisation#
Pour entraîner un modèle YOLO26n-pose sur le jeu de données COCO-Pose pendant 100 epochs avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, réfère-toi à la page Entraînement du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)Link to this sectionExemples d'images et annotations#
Le jeu de données COCO-Pose contient un ensemble diversifié d'images avec des silhouettes humaines annotées avec des points clés. Voici quelques exemples d'images issues du jeu de données, accompagnées de leurs annotations correspondantes :

- Image mosaïquée : Cette image montre un lot d'entraînement composé d'images du jeu de données mosaïquées. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule pour augmenter la variété des objets et des scènes au sein de chaque lot d'entraînement. Cela aide à améliorer la capacité du modèle à généraliser à différentes tailles d'objets, ratios d'aspect et contextes.
L'exemple met en valeur la variété et la complexité des images dans le jeu de données COCO-Pose ainsi que les avantages de l'utilisation de la mosaïque pendant le processus d'entraînement.
Link to this sectionCitations et remerciements#
Si tu utilises le jeu de données COCO-Pose dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}Nous tenons à remercier le COCO Consortium pour avoir créé et maintenu cette ressource précieuse pour la communauté de la computer vision. Pour plus d'informations sur le jeu de données COCO-Pose et ses créateurs, visite le site web du jeu de données COCO.
Link to this sectionFAQ#
Link to this sectionQu'est-ce que le jeu de données COCO-Pose et comment est-il utilisé avec Ultralytics YOLO pour l'estimation de pose ?#
Le jeu de données COCO-Pose est une version spécialisée du jeu de données COCO (Common Objects in Context) conçue pour les tâches d'estimation de pose. Il s'appuie sur les images et les annotations COCO Keypoints 2017, permettant l'entraînement de modèles comme Ultralytics YOLO pour une estimation de pose détaillée. Par exemple, tu peux utiliser le jeu de données COCO-Pose pour entraîner un modèle YOLO26n-pose en chargeant un modèle pré-entraîné et en l'entraînant avec une configuration YAML. Pour des exemples d'entraînement, réfère-toi à la documentation Entraînement.
Link to this sectionComment puis-je entraîner un modèle YOLO26 sur le jeu de données COCO-Pose ?#
L'entraînement d'un modèle YOLO26 sur le jeu de données COCO-Pose peut être accompli en utilisant soit Python, soit des commandes CLI. Par exemple, pour entraîner un modèle YOLO26n-pose pendant 100 epochs avec une taille d'image de 640, tu peux suivre les étapes ci-dessous :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)Pour plus de détails sur le processus d'entraînement et les arguments disponibles, consulte la page d'entraînement.
Link to this sectionQuelles sont les différentes métriques fournies par le jeu de données COCO-Pose pour évaluer les performances d'un modèle ?#
Le jeu de données COCO-Pose fournit plusieurs métriques d'évaluation standardisées pour les tâches d'estimation de pose, similaires au jeu de données COCO original. Les métriques clés incluent l'Object Keypoint Similarity (OKS), qui évalue la précision des points clés prédits par rapport aux annotations de vérité terrain. Ces métriques permettent des comparaisons de performance approfondies entre différents modèles. Par exemple, les modèles pré-entraînés COCO-Pose tels que YOLO26n-pose, YOLO26s-pose, et d'autres ont des métriques de performance spécifiques listées dans la documentation, comme mAPpose50-95 et mAPpose50.
Link to this sectionComment le jeu de données est-il structuré et divisé pour le jeu de données COCO-Pose ?#
Le jeu de données COCO-Pose est divisé en trois sous-ensembles :
- Train2017 : Contient 56599 images COCO, annotées pour l'entraînement de modèles d'estimation de pose.
- Val2017 : 2346 images à des fins de validation pendant l'entraînement du modèle.
- Test2017 : Images utilisées pour tester et évaluer les modèles entraînés. Les annotations de vérité terrain pour ce sous-ensemble ne sont pas accessibles au public ; les résultats sont soumis au COCO evaluation server pour l'évaluation des performances.
Ces sous-ensembles aident à organiser efficacement les phases d'entraînement, de validation et de test. Pour les détails de configuration, explore le fichier coco-pose.yaml disponible sur GitHub.
Link to this sectionQuelles sont les fonctionnalités clés et les applications du jeu de données COCO-Pose ?#
Le jeu de données COCO-Pose étend les annotations COCO Keypoints 2017 pour inclure 17 points clés pour les silhouettes humaines, permettant une estimation de pose détaillée. Des métriques d'évaluation standardisées (ex: OKS) facilitent les comparaisons entre différents modèles. Les applications du jeu de données COCO-Pose couvrent divers domaines, tels que l'analyse sportive, la santé, et l'interaction homme-machine, partout où une estimation de pose détaillée des silhouettes humaines est requise. Pour une utilisation pratique, tirer parti des modèles pré-entraînés comme ceux fournis dans la documentation (ex: YOLO26n-pose) peut considérablement simplifier le processus (Fonctionnalités clés).
Si tu utilises le jeu de données COCO-Pose dans tes travaux de recherche ou de développement, merci de citer l'article avec l'entrée BibTeX suivante.