Estimación de Pose
La estimación de pose es una tarea que implica identificar la ubicación de puntos específicos en una imagen, comúnmente referidos como puntos clave. Estos puntos clave pueden representar varias partes del objeto, como articulaciones, puntos de referencia u otras características distintivas. La ubicación de los puntos clave generalmente se representa como un conjunto de coordenadas 2D [x, y]
o 3D [x, y, visible]
.
La salida de un modelo de estimación de pose es un conjunto de puntos que representan los puntos clave en un objeto de la imagen, generalmente junto con las puntuaciones de confianza para cada punto. La estimación de pose es una buena opción cuando se necesita identificar partes específicas de un objeto en una escena y su ubicación relativa entre ellas.
Ver: Estimación de Pose con Ultralytics YOLOv8.
Consejo
Los modelos pose YOLOv8 utilizan el sufijo -pose
, por ejemplo, yolov8n-pose.pt
. Estos modelos están entrenados en el conjunto de datos COCO keypoints y son adecuados para una variedad de tareas de estimación de pose.
Modelos
Aquí se muestran los modelos preentrenados de YOLOv8 Pose. Los modelos Detect, Segment y Pose están preentrenados en el conjunto de datos COCO, mientras que los modelos Classify están preentrenados en el conjunto de datos ImageNet.
Los modelos se descargan automáticamente desde el último lanzamiento de Ultralytics release en el primer uso.
Modelo | tamaño (píxeles) |
mAPpose 50-95 |
mAPpose 50 |
Velocidad CPU ONNX (ms) |
Velocidad A100 TensorRT (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|---|
YOLOv8n-pose | 640 | 50.4 | 80.1 | 131.8 | 1.18 | 3.3 | 9.2 |
YOLOv8s-pose | 640 | 60.0 | 86.2 | 233.2 | 1.42 | 11.6 | 30.2 |
YOLOv8m-pose | 640 | 65.0 | 88.8 | 456.3 | 2.00 | 26.4 | 81.0 |
YOLOv8l-pose | 640 | 67.6 | 90.0 | 784.5 | 2.59 | 44.4 | 168.6 |
YOLOv8x-pose | 640 | 69.2 | 90.2 | 1607.1 | 3.73 | 69.4 | 263.2 |
YOLOv8x-pose-p6 | 1280 | 71.6 | 91.2 | 4088.7 | 10.04 | 99.1 | 1066.4 |
- Los valores de mAPval son para un solo modelo a una sola escala en el conjunto de datos COCO Keypoints val2017.
Reproducir conyolo val pose data=coco-pose.yaml device=0
- Velocidad promediada sobre imágenes COCO val usando una instancia Amazon EC2 P4d.
Reproducir conyolo val pose data=coco8-pose.yaml batch=1 device=0|cpu
Entrenar
Entrena un modelo YOLOv8-pose en el conjunto de datos COCO128-pose.
Ejemplo
from ultralytics import YOLO
# Cargar un modelo
model = YOLO('yolov8n-pose.yaml') # construir un nuevo modelo desde YAML
model = YOLO('yolov8n-pose.pt') # cargar un modelo preentrenado (recomendado para entrenar)
model = YOLO('yolov8n-pose.yaml').load('yolov8n-pose.pt') # construir desde YAML y transferir los pesos
# Entrenar el modelo
results = model.train(data='coco8-pose.yaml', epochs=100, imgsz=640)
# Construir un nuevo modelo desde YAML y comenzar entrenamiento desde cero
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.yaml epochs=100 imgsz=640
# Empezar entrenamiento desde un modelo *.pt preentrenado
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.pt epochs=100 imgsz=640
# Construir un nuevo modelo desde YAML, transferir pesos preentrenados y comenzar entrenamiento
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.yaml pretrained=yolov8n-pose.pt epochs=100 imgsz=640
Formato del conjunto de datos
El formato del conjunto de datos de pose de YOLO se puede encontrar en detalle en la Guía de Conjuntos de Datos. Para convertir tu conjunto de datos existente de otros formatos (como COCO, etc.) al formato de YOLO, usa la herramienta JSON2YOLO de Ultralytics.
Validar
Valida la precisión del modelo YOLOv8n-pose entrenado en el conjunto de datos COCO128-pose. No es necesario pasar ningún argumento ya que el modelo
mantiene sus datos
de entrenamiento y argumentos como atributos del modelo.
Ejemplo
from ultralytics import YOLO
# Cargar un modelo
model = YOLO('yolov8n-pose.pt') # cargar un modelo oficial
model = YOLO('path/to/best.pt') # cargar un modelo personalizado
# Validar el modelo
metrics = model.val() # no se necesitan argumentos, el conjunto de datos y configuraciones se recuerdan
metrics.box.map # map50-95
metrics.box.map50 # map50
metrics.box.map75 # map75
metrics.box.maps # una lista contiene map50-95 de cada categoría
Predecir
Usa un modelo YOLOv8n-pose entrenado para realizar predicciones en imágenes.
Ejemplo
Consulta los detalles completos del modo predict
en la página de Predicción.
Exportar
Exporta un modelo YOLOv8n Pose a un formato diferente como ONNX, CoreML, etc.
Ejemplo
Los formatos de exportación de YOLOv8-pose disponibles se muestran en la tabla a continuación. Puedes predecir o validar directamente en modelos exportados, por ejemplo, yolo predict model=yolov8n-pose.onnx
. Los ejemplos de uso se muestran para tu modelo después de que la exportación se completa.
Formato | Argumento format |
Modelo | Metadatos | Argumentos |
---|---|---|---|---|
PyTorch | - | yolov8n-pose.pt |
✅ | - |
TorchScript | torchscript |
yolov8n-pose.torchscript |
✅ | imgsz , optimize |
ONNX | onnx |
yolov8n-pose.onnx |
✅ | imgsz , half , dinámico , simplify , opset |
OpenVINO | openvino |
yolov8n-pose_openvino_model/ |
✅ | imgsz , half |
TensorRT | engine |
yolov8n-pose.engine |
✅ | imgsz , half , dinámico , simplify , espacio de trabajo |
CoreML | coreml |
yolov8n-pose.mlpackage |
✅ | imgsz , half , int8 , nms |
TF SavedModel | saved_model |
yolov8n-pose_saved_model/ |
✅ | imgsz , keras |
TF GraphDef | pb |
yolov8n-pose.pb |
❌ | imgsz |
TF Lite | tflite |
yolov8n-pose.tflite |
✅ | imgsz , half , int8 |
TF Edge TPU | edgetpu |
yolov8n-pose_edgetpu.tflite |
✅ | imgsz |
TF.js | tfjs |
yolov8n-pose_web_model/ |
✅ | imgsz |
PaddlePaddle | paddle |
yolov8n-pose_paddle_model/ |
✅ | imgsz |
ncnn | ncnn |
yolov8n-pose_ncnn_model/ |
✅ | imgsz , half |
Consulta los detalles completos del modo export
en la página de Exportación.