Vai al contenuto

Stima della posa

Esempi di stima della posa

La stima della posa è un'attività che prevede l'identificazione della posizione di punti specifici in un'immagine, solitamente indicati come punti chiave. I punti chiave possono rappresentare varie parti dell'oggetto come articolazioni, punti di riferimento o altre caratteristiche distintive. Le posizioni dei punti chiave sono solitamente rappresentate come un insieme di punti chiave 2D. [x, y] o 3D [x, y, visible] coordinate.

L'output di un modello di stima della posa è un insieme di punti che rappresentano i punti chiave di un oggetto nell'immagine, solitamente insieme ai punteggi di confidenza per ogni punto. La stima della posa è una buona scelta quando hai bisogno di identificare parti specifiche di un oggetto in una scena e la loro posizione rispetto agli altri.



Guarda: Stima della posa con Ultralytics YOLOv8 .

Suggerimento

YOLOv8 posa i modelli utilizzano il metodo -pose suffisso, cioè yolov8n-pose.pt. Questi modelli vengono addestrati sulla base di Punti chiave di COCO e sono adatti a una serie di compiti di stima della posa.

Modelli

YOLOv8 I modelli Pose pre-addestrati sono mostrati qui. I modelli Detect, Segment e Pose sono stati preaddestrati sul dataset COCO, mentre i modelli Classify sono stati preaddestrati sul dataset ImageNet.

I modelli vengono scaricati automaticamente dall'ultimarelease di Ultralytics al primo utilizzo.

Modello dimensione
(pixel)
mAPpose
50-95
mAPpose
50
Velocità
CPU ONNX
(ms)
Velocità
A100 TensorRT
(ms)
params
(M)
FLOP
(B)
YOLOv8n-possesso 640 50.4 80.1 131.8 1.18 3.3 9.2
YOLOv8s-possesso 640 60.0 86.2 233.2 1.42 11.6 30.2
YOLOv8m-possesso 640 65.0 88.8 456.3 2.00 26.4 81.0
YOLOv8l-possesso 640 67.6 90.0 784.5 2.59 44.4 168.6
YOLOv8x-possesso 640 69.2 90.2 1607.1 3.73 69.4 263.2
YOLOv8x-pose-p6 1280 71.6 91.2 4088.7 10.04 99.1 1066.4
  • mAPval I valori si riferiscono a un modello a scala singola su Punti chiave COCO val2017 set di dati.
    Riproduci da yolo val pose data=coco-pose.yaml device=0
  • Velocità mediata sulle immagini COCO val utilizzando un Amazon EC2 P4d istanza.
    Riproduci da yolo val pose data=coco8-pose.yaml batch=1 device=0|cpu

Treno

Addestrare un modello YOLOv8-pose sul dataset COCO128-pose.

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.yaml')  # build a new model from YAML
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)
model = YOLO('yolov8n-pose.yaml').load('yolov8n-pose.pt')  # build from YAML and transfer weights

# Train the model
results = model.train(data='coco8-pose.yaml', epochs=100, imgsz=640)
# Build a new model from YAML and start training from scratch
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.yaml epochs=100 imgsz=640

# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.pt epochs=100 imgsz=640

# Build a new model from YAML, transfer pretrained weights to it and start training
yolo pose train data=coco8-pose.yaml model=yolov8n-pose.yaml pretrained=yolov8n-pose.pt epochs=100 imgsz=640

Formato del set di dati

YOLO Il formato dei set di dati può essere consultato in dettaglio nella Guida ai set di dati. Per convertire il tuo set di dati esistente da altri formati (come COCO ecc.) al formato YOLO , utilizza lo strumento JSON2YOLO di Ultralytics.

Val

Convalida l'accuratezza del modello addestrato YOLOv8n-pose sul set di dati COCO128-pose. Non è necessario passare alcun argomento come il parametro model mantiene la formazione data e gli argomenti come attributi del modello.

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load an official model
model = YOLO('path/to/best.pt')  # load a custom model

# Validate the model
metrics = model.val()  # no arguments needed, dataset and settings remembered
metrics.box.map    # map50-95
metrics.box.map50  # map50
metrics.box.map75  # map75
metrics.box.maps   # a list contains map50-95 of each category
yolo pose val model=yolov8n-pose.pt  # val official model
yolo pose val model=path/to/best.pt  # val custom model

Prevedere

Utilizza un modello addestrato YOLOv8n per eseguire previsioni sulle immagini.

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load an official model
model = YOLO('path/to/best.pt')  # load a custom model

# Predict with the model
results = model('https://ultralytics.com/images/bus.jpg')  # predict on an image
yolo pose predict model=yolov8n-pose.pt source='https://ultralytics.com/images/bus.jpg'  # predict with official model
yolo pose predict model=path/to/best.pt source='https://ultralytics.com/images/bus.jpg'  # predict with custom model

Vedi tutto predict i dettagli della modalità nella sezione Prevedere pagina.

Esportazione

Esporta un modello di posa YOLOv8n in un formato diverso come ONNX, CoreML, ecc.

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load an official model
model = YOLO('path/to/best.pt')  # load a custom trained model

# Export the model
model.export(format='onnx')
yolo export model=yolov8n-pose.pt format=onnx  # export official model
yolo export model=path/to/best.pt format=onnx  # export custom trained model

I formati di esportazione disponibili di YOLOv8-pose sono riportati nella tabella sottostante. Puoi prevedere o convalidare direttamente i modelli esportati, ad es. yolo predict model=yolov8n-pose.onnx. Al termine dell'esportazione vengono mostrati degli esempi di utilizzo per il tuo modello.

Formato format Argomento Modello Metadati Argomenti
PyTorch - yolov8n-pose.pt -
TorchScript torchscript yolov8n-pose.torchscript imgsz, optimize
ONNX onnx yolov8n-pose.onnx imgsz, half, dynamic, simplify, opset
OpenVINO openvino yolov8n-pose_openvino_model/ imgsz, half, int8
TensorRT engine yolov8n-pose.engine imgsz, half, dynamic, simplify, workspace
CoreML coreml yolov8n-pose.mlpackage imgsz, half, int8, nms
TF SavedModel saved_model yolov8n-pose_saved_model/ imgsz, keras
TF GraphDef pb yolov8n-pose.pb imgsz
TF Lite tflite yolov8n-pose.tflite imgsz, half, int8
TF Bordo TPU edgetpu yolov8n-pose_edgetpu.tflite imgsz
TF.js tfjs yolov8n-pose_web_model/ imgsz, half, int8
PaddlePaddle paddle yolov8n-pose_paddle_model/ imgsz
ncnn ncnn yolov8n-pose_ncnn_model/ imgsz, half

Vedi tutto export dettagli nella sezione Esportazione pagina.



Creato 2023-11-12, Aggiornato 2024-02-03
Autori: glenn-jocher (10), AyushExel (1), Laughing-q (1)

Commenti