Estimation de pose
L'estimation de pose est une tâche qui consiste à identifier l'emplacement de points spécifiques dans une image, généralement appelés points clés. Les points clés peuvent représenter diverses parties de l'objet, telles que les articulations, les points de repère ou d'autres caractéristiques distinctives. Les emplacements des points clés sont généralement représentés par un ensemble de 2D [x, y]
ou 3D [x, y, visible]
coordonnées.
La sortie d'un modèle d'estimation de pose est un ensemble de points qui représentent les points clés d'un objet dans l'image, généralement accompagnés des scores de confiance pour chaque point. L'estimation de pose est un bon choix lorsque vous devez identifier des parties spécifiques d'un objet dans une scène, et leur emplacement les unes par rapport aux autres.
Regarder : Tutoriel d'estimation de pose Ultralytics YOLO11 | Suivi d'objets en temps réel et détection de pose humaine
Astuce
YOLO11 pose les modèles utilisent le -pose
suffixe, c'est-à-dire yolo11n-pose.pt
. Ces modèles sont entraînés sur le jeu de données COCO keypoints et conviennent à une variété de tâches d'estimation de pose.
Dans le modèle de pose YOLO11 par défaut, il existe 17 points clés, chacun représentant une partie différente du corps humain. Voici le mappage de chaque index à son articulation corporelle respective :
- Nez
- Oeil Gauche
- Oeil droit
- Oreille Gauche
- Oreille droite
- Épaule gauche
- Épaule droite
- Coude Gauche
- Coude droit
- Poignet gauche
- Poignet droit
- Hanche Gauche
- Hanche droite
- Genou Gauche
- Genou droit
- Cheville Gauche
- Cheville droite
Modèles
Les modèles de pose pré-entraînés Ultralytics YOLO11 sont présentés ici. Les modèles de détection, de segmentation et de pose sont pré-entraînés sur l'ensemble de données COCO, tandis que les modèles de classification sont pré-entraînés sur l'ensemble de données ImageNet.
Les modèles sont téléchargés automatiquement depuis la dernière version d'Ultralytics lors de la première utilisation.
Modèle | Taille (pixels) |
mAPpose 50-95 |
mAPpose 50 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|---|
YOLO11n-pose | 640 | 50.0 | 81.0 | 52,4 ± 0,5 | 1,7 ± 0,0 | 2.9 | 7.6 |
YOLO11s-pose | 640 | 58.9 | 86.3 | 90,5 ± 0,6 | 2,6 ± 0,0 | 9.9 | 23.2 |
YOLO11m-pose | 640 | 64.9 | 89.4 | 187,3 ± 0,8 | 4,9 ± 0,1 | 20.9 | 71.7 |
YOLO11l-pose | 640 | 66.1 | 89.9 | 247,7 ± 1,1 | 6,4 ± 0,1 | 26.2 | 90.7 |
YOLO11x-pose | 640 | 69.5 | 91.1 | 488,0 ± 13,9 | 12,1 ± 0,2 | 58.8 | 203.3 |
- mAPval Les valeurs COCO Keypoints val2017 dataset.
Reproduire en utilisantyolo val pose data=coco-pose.yaml device=0
- Vitesse moyennée sur les images COCO val en utilisant une instance Amazon EC2 P4d. instance.
Reproduire en utilisantyolo val pose data=coco-pose.yaml batch=1 device=0|cpu
Entraîner
Entraîner un modèle YOLO11-pose sur le jeu de données COCO8-pose. Le jeu de données COCO8-pose est un petit échantillon de jeu de données parfait pour tester et déboguer vos modèles d'estimation de pose.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n-pose.yaml").load("yolo11n-pose.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Build a new model from YAML and start training from scratch
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml epochs=100 imgsz=640
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
# Build a new model from YAML, transfer pretrained weights to it and start training
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml pretrained=yolo11n-pose.pt epochs=100 imgsz=640
Format du jeu de données
Le format de l'ensemble de données de pose YOLO peut être trouvé en détail dans le Guide de l'ensemble de données. Pour convertir votre ensemble de données existant à partir d'autres formats (comme COCO etc.) au format YOLO, veuillez utiliser l'outil JSON2YOLO par Ultralytics.
Pour les tâches personnalisées d'estimation de pose, vous pouvez également explorer des ensembles de données spécialisés comme Tiger-Pose pour l'estimation de la pose animale, Hand Keypoints pour le suivi des mains, ou Dog-Pose pour l'analyse de la pose canine.
Valider
Valider le modèle YOLO11n-pose entraîné précision sur le jeu de données COCO8-pose. Aucun argument n'est nécessaire car le model
conserve son entraînement data
et ses arguments en tant qu'attributs du modèle.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
metrics.box.map # map50-95
metrics.box.map50 # map50
metrics.box.map75 # map75
metrics.box.maps # a list contains map50-95 of each category
metrics.pose.map # map50-95(P)
metrics.pose.map50 # map50(P)
metrics.pose.map75 # map75(P)
metrics.pse.maps # a list contains map50-95(P) of each category
yolo pose val model=yolo11n-pose.pt # val official model
yolo pose val model=path/to/best.pt # val custom model
Prédire
Utilisez un modèle YOLO11n-pose entraîné pour exécuter des prédictions sur des images. Le mode de prédiction vous permet d'effectuer une inférence sur des images, des vidéos ou des flux en temps réel.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg") # predict on an image
# Access the results
for result in results:
xy = result.keypoints.xy # x and y coordinates
xyn = result.keypoints.xyn # normalized
kpts = result.keypoints.data # x, y, visibility (if available)
yolo pose predict model=yolo11n-pose.pt source='https://ultralytics.com/images/bus.jpg' # predict with official model
yolo pose predict model=path/to/best.pt source='https://ultralytics.com/images/bus.jpg' # predict with custom model
Voir tous les predict
détails du mode dans la Prédire page.
Exporter
Exporter un modèle de pose YOLO11n vers un format différent comme ONNX, CoreML, etc. Cela vous permet de déployer votre modèle sur diverses plateformes et appareils pour une inférence en temps réel.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom trained model
# Export the model
model.export(format="onnx")
yolo export model=yolo11n-pose.pt format=onnx # export official model
yolo export model=path/to/best.pt format=onnx # export custom trained model
Les formats d'exportation YOLO11-pose disponibles sont dans le tableau ci-dessous. Vous pouvez exporter vers n'importe quel format en utilisant le format
argument, c'est-à-dire format='onnx'
ou format='engine'
. Vous pouvez prédire ou valider directement sur les modèles exportés, c'est-à-dire yolo predict model=yolo11n-pose.onnx
. Des exemples d'utilisation sont présentés pour votre modèle une fois l'exportation terminée.
Format | format Argument |
Modèle | Métadonnées | Arguments |
---|---|---|---|---|
PyTorch | - | yolo11n-pose.pt |
✅ | - |
TorchScript | torchscript |
yolo11n-pose.torchscript |
✅ | imgsz , half , dynamic , optimize , nms , batch , device |
ONNX | onnx |
yolo11n-pose.onnx |
✅ | imgsz , half , dynamic , simplify , opset , nms , batch , device |
OpenVINO | openvino |
yolo11n-pose_openvino_model/ |
✅ | imgsz , half , dynamic , int8 , nms , batch , data , fraction , device |
TensorRT | engine |
yolo11n-pose.engine |
✅ | imgsz , half , dynamic , simplify , workspace , int8 , nms , batch , data , fraction , device |
CoreML | coreml |
yolo11n-pose.mlpackage |
✅ | imgsz , half , int8 , nms , batch , device |
TF SavedModel | saved_model |
yolo11n-pose_saved_model/ |
✅ | imgsz , keras , int8 , nms , batch , device |
TF GraphDef | pb |
yolo11n-pose.pb |
❌ | imgsz , batch , device |
TF Lite | tflite |
yolo11n-pose.tflite |
✅ | imgsz , half , int8 , nms , batch , data , fraction , device |
TF Edge TPU | edgetpu |
yolo11n-pose_edgetpu.tflite |
✅ | imgsz , device |
TF.js | tfjs |
yolo11n-pose_web_model/ |
✅ | imgsz , half , int8 , nms , batch , device |
PaddlePaddle | paddle |
yolo11n-pose_paddle_model/ |
✅ | imgsz , batch , device |
MNN | mnn |
yolo11n-pose.mnn |
✅ | imgsz , batch , int8 , half , device |
NCNN | ncnn |
yolo11n-pose_ncnn_model/ |
✅ | imgsz , half , batch , device |
IMX500 | imx |
yolo11n-pose_imx_model/ |
✅ | imgsz , int8 , data , fraction , device |
RKNN | rknn |
yolo11n-pose_rknn_model/ |
✅ | imgsz , batch , name , device |
Voir tous les export
détails dans la section Exporter page.
FAQ
Qu'est-ce que l'estimation de pose avec Ultralytics YOLO11 et comment ça marche ?
L'estimation de pose avec Ultralytics YOLO11 implique l'identification de points spécifiques, appelés points clés, dans une image. Ces points clés représentent généralement les articulations ou d'autres caractéristiques importantes de l'objet. La sortie comprend les [x, y]
coordonnées et les scores de confiance pour chaque point. Les modèles YOLO11-pose sont spécialement conçus pour cette tâche et utilisent le -pose
suffixe, tel que yolo11n-pose.pt
. Ces modèles sont pré-entraînés sur des jeux de données comme jeu de données COCO keypoints et peut être utilisé pour diverses tâches d'estimation de pose. Pour plus d'informations, consultez la Page d'estimation de pose.
Comment puis-je entraîner un modèle YOLO11-pose sur un ensemble de données personnalisé ?
L'entraînement d'un modèle de pose YOLO11 sur un ensemble de données personnalisé implique le chargement d'un modèle, soit un nouveau modèle défini par un fichier YAML, soit un modèle pré-entraîné. Vous pouvez ensuite démarrer le processus d'entraînement en utilisant l'ensemble de données et les paramètres que vous avez spécifiés.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)
Pour des informations complètes sur l'entraînement, consultez la Section Entraînement. Vous pouvez également utiliser Ultralytics HUB pour une approche sans code de l'entraînement de modèles personnalisés d'estimation de pose.
Comment valider un modèle YOLO11-pose entraîné ?
La validation d'un modèle de pose YOLO11 implique l'évaluation de sa précision en utilisant les mêmes paramètres d'ensemble de données conservés pendant l'entraînement. Voici un exemple :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
Pour plus d'informations, consultez la Section Val.
Puis-je exporter un modèle YOLO11-pose vers d'autres formats, et comment ?
Oui, vous pouvez exporter un modèle de pose YOLO11 vers différents formats tels que ONNX, CoreML, TensorRT, et plus encore. Cela peut être fait en utilisant soit python, soit l'interface de ligne de commande (CLI).
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom trained model
# Export the model
model.export(format="onnx")
Consultez la section Exportation pour plus de détails. Les modèles exportés peuvent être déployés sur des appareils périphériques pour des applications en temps réel telles que le suivi de la condition physique, l'analyse sportive ou la robotique.
Quels sont les modèles Ultralytics YOLO11-pose disponibles et leurs métriques de performance ?
Ultralytics YOLO11 offre divers modèles de pose pré-entraînés tels que YOLO11n-pose, YOLO11s-pose, YOLO11m-pose, entre autres. Ces modèles diffèrent en taille, en précision (mAP) et en vitesse. Par exemple, le modèle YOLO11n-pose atteint un mAPpose50-95 de 50,0 et un mAPpose50 de 81,0. Pour une liste complète et des détails sur les performances, visitez la section Modèles.