Estimation de la pose
L'estimation de la pose est une tâche qui consiste à identifier l'emplacement de points spécifiques dans une image, généralement appelés points clés. Les points clés peuvent représenter différentes parties de l'objet, telles que des articulations, des points de repère ou d'autres caractéristiques distinctives. Les emplacements des points clés sont généralement représentés sous la forme d'un ensemble d'images 2D [x, y]
ou 3D [x, y, visible]
coordonnées.
Le résultat d'un modèle d'estimation de la pose est un ensemble de points représentant les points clés d'un objet dans l'image, généralement accompagné des scores de confiance pour chaque point. L'estimation de la pose est un bon choix lorsque vous devez identifier des parties spécifiques d'un objet dans une scène et leur emplacement les unes par rapport aux autres.
Regarder : Ultralytics YOLO11 Tutoriel sur l'estimation de la pose - Suivi d'objets en temps réel et détection de la pose humaine
Conseil
YOLO11 poser utilisent le modèle -pose
c'est-à-dire yolo11n-pose.pt
. Ces modèles sont formés sur les Points clés COCO et conviennent à une variété de tâches d'estimation de la pose.
Dans le modèle de pose par défaut de YOLO11 , il y a 17 points clés, chacun représentant une partie différente du corps humain. Voici la correspondance entre chaque index et son articulation corporelle respective :
- Nez
- Oeil gauche
- Œil droit
- Oreille gauche
- Oreille droite
- Epaule gauche
- Epaule droite
- Coude gauche
- Coude droit
- Poignet gauche
- Poignet droit
- Hanche gauche
- Hanche droite
- Genou gauche
- Genou droit
- Cheville gauche
- Cheville droite
Modèles
Les modèles Pose pré-entraînés d'Ultralytics YOLO11 sont présentés ici. Les modèles de détection, de segmentation et de pose sont pré-entraînés sur l'ensemble de données COCO, tandis que les modèles de classification sont pré-entraînés sur l'ensemble de données ImageNet.
Les modèles se téléchargent automatiquement à partir de la dernièreversion de Ultralytics lors de la première utilisation.
Modèle | taille (pixels) |
mAPpose 50-95 |
mAPpose 50 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|---|
YOLO11n-pose | 640 | 50.0 | 81.0 | 52.4 ± 0.5 | 1.7 ± 0.0 | 2.9 | 7.6 |
YOLO11s-pose | 640 | 58.9 | 86.3 | 90.5 ± 0.6 | 2.6 ± 0.0 | 9.9 | 23.2 |
YOLO11m-pose | 640 | 64.9 | 89.4 | 187.3 ± 0.8 | 4.9 ± 0.1 | 20.9 | 71.7 |
YOLO11l-pose | 640 | 66.1 | 89.9 | 247.7 ± 1.1 | 6.4 ± 0.1 | 26.2 | 90.7 |
YOLO11x-pose | 640 | 69.5 | 91.1 | 488.0 ± 13.9 | 12.1 ± 0.2 | 58.8 | 203.3 |
- mAPval Les valeurs sont celles d'un seul modèle à une seule échelle sur Points clés COCO val2017 données.
Reproduire paryolo val pose data=coco-pose.yaml device=0
- Vitesse La moyenne des images COCO val est calculée à l'aide d'un Amazon EC2 P4d instance.
Reproduire paryolo val pose data=coco-pose.yaml batch=1 device=0|cpu
Train
Entraînez un modèle YOLO11 sur l'ensemble de données COCO8-pose. Le jeu de données COCO8-pose est un petit échantillon de données parfait pour tester et déboguer vos modèles d'estimation de pose.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n-pose.yaml").load("yolo11n-pose.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Build a new model from YAML and start training from scratch
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml epochs=100 imgsz=640
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
# Build a new model from YAML, transfer pretrained weights to it and start training
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.yaml pretrained=yolo11n-pose.pt epochs=100 imgsz=640
Format des données
Le format du jeu de données YOLO pose peut être consulté en détail dans le Guide des jeux de données. Pour convertir votre jeu de données existant dans d'autres formats (comme COCO, etc.) au format YOLO , veuillez utiliser l'outil JSON2YOLO d'Ultralytics.
Pour les tâches d'estimation de pose personnalisées, vous pouvez également explorer des ensembles de données spécialisés tels que Tiger-Pose pour l'estimation de la pose des animaux, Hand Keypoints pour le suivi des mains ou Dog-Pose pour l'analyse de la pose des chiens.
Val
Valider le modèle YOLO11n-pose entraîné précision sur le jeu de données COCO8-pose. Aucun argument n'est nécessaire car la fonction model
conserve sa formation data
et les arguments en tant qu'attributs du modèle.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
metrics.box.map # map50-95
metrics.box.map50 # map50
metrics.box.map75 # map75
metrics.box.maps # a list contains map50-95 of each category
Prévoir
Utilisez un modèle YOLO11n-pose entraîné pour effectuer des prédictions sur des images. Le mode prédictif vous permet d'effectuer des inférences sur des images, des vidéos ou des flux en temps réel.
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg") # predict on an image
# Access the results
for result in results:
xy = result.keypoints.xy # x and y coordinates
xyn = result.keypoints.xyn # normalized
kpts = result.keypoints.data # x, y, visibility (if available)
Voir l'intégralité predict
dans la section Prévoir page.
Exportation
Exporter un modèle YOLO11n Pose vers un format différent comme ONNX, CoreML, etc. Cela vous permet de déployer votre modèle sur différentes plateformes et appareils pour une inférence en temps réel.
Exemple
Les formats d'exportation disponibles pour YOLO11-pose sont présentés dans le tableau ci-dessous. Vous pouvez exporter vers n'importe quel format à l'aide de la fonction format
l'argument, c'est-à-dire format='onnx'
ou format='engine'
. Vous pouvez prédire ou valider directement les modèles exportés, c'est-à-dire yolo predict model=yolo11n-pose.onnx
. Des exemples d'utilisation sont présentés pour votre modèle une fois l'exportation terminée.
Format | format Argument |
Modèle | Métadonnées | Arguments |
---|---|---|---|---|
PyTorch | - | yolo11n-pose.pt |
✅ | - |
TorchScript | torchscript |
yolo11n-pose.torchscript |
✅ | imgsz , optimize , nms , batch |
ONNX | onnx |
yolo11n-pose.onnx |
✅ | imgsz , half , dynamic , simplify , opset , nms , batch |
OpenVINO | openvino |
yolo11n-pose_openvino_model/ |
✅ | imgsz , half , dynamic , int8 , nms , batch , data |
TensorRT | engine |
yolo11n-pose.engine |
✅ | imgsz , half , dynamic , simplify , workspace , int8 , nms , batch , data |
CoreML | coreml |
yolo11n-pose.mlpackage |
✅ | imgsz , half , int8 , nms , batch |
TF SavedModel | saved_model |
yolo11n-pose_saved_model/ |
✅ | imgsz , keras , int8 , nms , batch |
TF GraphDef | pb |
yolo11n-pose.pb |
❌ | imgsz , batch |
TF Lite | tflite |
yolo11n-pose.tflite |
✅ | imgsz , half , int8 , nms , batch , data |
TF Bord TPU | edgetpu |
yolo11n-pose_edgetpu.tflite |
✅ | imgsz |
TF.js | tfjs |
yolo11n-pose_web_model/ |
✅ | imgsz , half , int8 , nms , batch |
PaddlePaddle | paddle |
yolo11n-pose_paddle_model/ |
✅ | imgsz , batch |
MNN | mnn |
yolo11n-pose.mnn |
✅ | imgsz , batch , int8 , half |
NCNN | ncnn |
yolo11n-pose_ncnn_model/ |
✅ | imgsz , half , batch |
IMX500 | imx |
yolo11n-pose_imx_model/ |
✅ | imgsz , int8 , data |
RKNN | rknn |
yolo11n-pose_rknn_model/ |
✅ | imgsz , batch , name |
Voir l'intégralité export
détails dans le Exportation page.
FAQ
Qu'est-ce que l'estimation de la pose avec Ultralytics YOLO11 et comment fonctionne-t-elle ?
L'estimation de la pose à l'aide de Ultralytics YOLO11 implique l'identification de points spécifiques, appelés points clés, dans une image. Ces points clés représentent généralement des articulations ou d'autres caractéristiques importantes de l'objet. Le résultat comprend la [x, y]
les coordonnées et les indices de confiance pour chaque point. YOLO11 Les modèles -pose sont spécifiquement conçus pour cette tâche et utilisent le modèle -pose
suffixe, tel que yolo11n-pose.pt
. Ces modèles sont pré-entraînés sur des ensembles de données tels que Points clés COCO et peut être utilisé pour diverses tâches d'estimation de la pose. Pour plus d'informations, visitez le site Page d'estimation de la pose.
Comment puis-je entraîner un modèle YOLO11-pose sur un ensemble de données personnalisé ?
L'entraînement d'un modèle YOLO11-pose sur un ensemble de données personnalisé implique le chargement d'un modèle, qu'il s'agisse d'un nouveau modèle défini par un fichier YAML ou d'un modèle pré-entraîné. Vous pouvez ensuite lancer le processus d'entraînement en utilisant l'ensemble de données et les paramètres que vous avez spécifiés.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.yaml") # build a new model from YAML
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)
Pour plus de détails sur l'entraînement, reportez-vous à la section Entraînement. Vous pouvez également utiliser Ultralytics HUB pour une approche sans code de l'entraînement des modèles d'estimation de pose personnalisés.
Comment valider un modèle entraîné YOLO11-pose ?
La validation d'un modèle YOLO11-pose consiste à évaluer sa précision en utilisant les mêmes paramètres de l'ensemble de données que ceux retenus lors de la formation. En voici un exemple :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
Pour plus d'informations, consultez la section Val.
Puis-je exporter un modèle YOLO11-pose vers d'autres formats, et comment ?
Oui, vous pouvez exporter un modèle YOLO11-pose dans différents formats tels que ONNX, CoreML, TensorRT, et bien d'autres. Cette opération peut être effectuée à l'aide de Python ou de l'interface de ligne de commande (CLI).
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom trained model
# Export the model
model.export(format="onnx")
Reportez-vous à la section Exportation pour plus de détails. Les modèles exportés peuvent être déployés sur des appareils périphériques pour des applications en temps réel telles que le suivi de la condition physique, l'analyse sportive ou la robotique.
Quels sont les modèles disponibles Ultralytics YOLO11 -pose et leurs performances ?
Ultralytics YOLO11 propose différents modèles de pose pré-entraînés tels que YOLO11n-pose, YOLO11s-pose, YOLO11m-pose, entre autres. Ces modèles diffèrent par leur taille, leur précision (mAP) et leur vitesse. Par exemple, le modèle YOLO11n-pose atteint une mAPpose50-95de 50,0 et une mAPpose50de 81,0. Pour obtenir une liste complète et des détails sur les performances, consultez la section Modèles.