Stima della posa
La stima della posa è un compito che comporta l'identificazione della posizione di punti specifici in un'immagine, solitamente chiamati keypoint. I keypoint possono rappresentare varie parti dell'oggetto come articolazioni, punti di riferimento o altre caratteristiche distintive. Le posizioni dei keypoint sono solitamente rappresentate come un insieme di coordinate 2D [x, y] o 3D [x, y, visible].
L'output di un modello di stima della posa è un insieme di punti che rappresentano i keypoint su un oggetto nell'immagine, solitamente insieme ai punteggi di confidenza per ogni punto. La stima della posa è un'ottima scelta quando devi identificare parti specifiche di un oggetto in una scena e la loro posizione in relazione l'una all'altra.
Watch: How to Run Real-Time Pose Estimation with Ultralytics YOLO26 | Tracking & Keypoints Extraction 🕺
I modelli YOLO26 pose utilizzano il suffisso -pose, ad esempio yolo26n-pose.pt. Questi modelli sono addestrati sul dataset COCO keypoints e sono adatti a una varietà di attività di stima della posa.
Nel modello di posa YOLO26 predefinito, ci sono 17 keypoint, ognuno dei quali rappresenta una parte diversa del corpo umano. Ecco la mappatura di ogni indice rispetto alla sua articolazione corporea:
- Naso
- Occhio sinistro
- Occhio destro
- Orecchio sinistro
- Orecchio destro
- Spalla sinistra
- Spalla destra
- Gomito sinistro
- Gomito destro
- Polso sinistro
- Polso destro
- Anca sinistra
- Anca destra
- Ginocchio sinistro
- Ginocchio destro
- Caviglia sinistra
- Caviglia destra
Modelli
I modelli di posa preaddestrati Ultralytics YOLO26 sono mostrati qui. I modelli Detect, Segment e Pose sono preaddestrati sul dataset COCO, mentre i modelli Classify sono preaddestrati sul dataset ImageNet.
I modelli si scaricano automaticamente dall'ultima release di Ultralytics al primo utilizzo.
| Modello | dimensione (pixel) | mAPpose 50-95(e2e) | mAPpose 50(e2e) | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | parametri (M) | FLOP (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n-pose | 640 | 57.2 | 83.3 | 40.3 ± 0.5 | 1.8 ± 0.0 | 2.9 | 7.5 |
| YOLO26s-pose | 640 | 63.0 | 86.6 | 85.3 ± 0.9 | 2.7 ± 0.0 | 10.4 | 23.9 |
| YOLO26m-pose | 640 | 68.8 | 89.6 | 218.0 ± 1.5 | 5.0 ± 0.1 | 21.5 | 73.1 |
| YOLO26l-pose | 640 | 70.4 | 90.5 | 275.4 ± 2.4 | 6.5 ± 0.1 | 25.9 | 91.3 |
| YOLO26x-pose | 640 | 71.6 | 91.6 | 565.4 ± 3.0 | 12.2 ± 0.2 | 57.6 | 201.7 |
- I valori mAPval sono riferiti al modello singolo su scala singola sul dataset COCO Keypoints val2017.
Riproduci conyolo val pose data=coco-pose.yaml device=0 - Velocità mediata sulle immagini di convalida COCO utilizzando un'istanza Amazon EC2 P4d.
Riproduci conyolo val pose data=coco-pose.yaml batch=1 device=0|cpu - I valori di Params e FLOPs si riferiscono al modello fuso dopo
model.fuse(), che unisce i livelli Conv e BatchNorm e, per i modelli end2end, rimuove l'head di rilevamento ausiliario one-to-many. I checkpoint pre-addestrati mantengono l'architettura di addestramento completa e potrebbero mostrare conteggi più elevati.
Train
Addestra un modello YOLO26-pose sul dataset COCO8-pose. Il dataset COCO8-pose è un piccolo dataset campione perfetto per testare e sottoporre a debug i tuoi modelli di stima della posa.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.yaml") # build a new model from YAML
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo26n-pose.yaml").load("yolo26n-pose.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)Vedi i dettagli completi della modalità train nella pagina Train. I modelli di posa possono anche essere addestrati su GPU in cloud tramite Ultralytics Platform.
Formato del dataset
Il formato del dataset di posa YOLO può essere trovato in dettaglio nella Guida ai Dataset. Per convertire il tuo dataset esistente da altri formati (come COCO ecc.) al formato YOLO, utilizza lo strumento JSON2YOLO di Ultralytics. Ultralytics Platform supporta anche l'annotazione della posa con modelli di scheletro integrati per persone, mani, volti e layout di keypoint personalizzati.
Per attività di stima della posa personalizzate, puoi anche esplorare dataset specializzati come Tiger-Pose per la stima della posa degli animali, Hand Keypoints per il tracciamento delle mani o Dog-Pose per l'analisi della posa canina.
Val
Convalida l' accuratezza del modello YOLO26n-pose addestrato sul dataset COCO8-pose. Non sono necessari argomenti poiché il model mantiene i suoi data di addestramento e gli argomenti come attributi del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings remembered
metrics.box.map # map50-95
metrics.box.map50 # map50
metrics.box.map75 # map75
metrics.box.maps # a list containing mAP50-95 for each category
metrics.box.image_metrics # per-image metrics dictionary for box with precision, recall, F1, TP, FP, and FN
metrics.pose.map # map50-95(P)
metrics.pose.map50 # map50(P)
metrics.pose.map75 # map75(P)
metrics.pose.maps # a list containing mAP50-95(P) for each category
metrics.pose.image_metrics # per-image metrics dictionary for pose with precision, recall, F1, TP, FP, and FNPredict
Usa un modello YOLO26n-pose addestrato per eseguire previsioni su immagini. La modalità predict ti permette di eseguire inferenza su immagini, video o flussi in tempo reale.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg") # predict on an image
# Access the results
for result in results:
xy = result.keypoints.xy # x and y coordinates
xyn = result.keypoints.xyn # normalized
kpts = result.keypoints.data # x, y, visibility (if available)Vedi i dettagli completi della modalità predict nella pagina Previsione.
Export
Esporta un modello YOLO26n Pose in un formato diverso come ONNX, CoreML, ecc. Questo ti permette di distribuire il tuo modello su varie piattaforme e dispositivi per l' inferenza in tempo reale.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom-trained model
# Export the model
model.export(format="onnx")I formati di esportazione YOLO26-pose disponibili sono nella tabella sottostante. Puoi esportare in qualsiasi formato utilizzando l'argomento format, ad esempio format='onnx' o format='engine'. Puoi prevedere o convalidare direttamente sui modelli esportati, ad esempio yolo predict model=yolo26n-pose.onnx. Esempi di utilizzo sono mostrati per il tuo modello dopo il completamento dell'esportazione.
| Formato | Argomento format | Modello | Metadati | Argomenti |
|---|---|---|---|---|
| PyTorch | - | yolo26n-pose.pt | ✅ | - |
| TorchScript | torchscript | yolo26n-pose.torchscript | ✅ | imgsz, half, dynamic, optimize, nms, batch, device |
| ONNX | onnx | yolo26n-pose.onnx | ✅ | imgsz, half, dynamic, simplify, opset, nms, batch, device |
| OpenVINO | openvino | yolo26n-pose_openvino_model/ | ✅ | imgsz, half, dynamic, int8, nms, batch, data, fraction, device |
| TensorRT | engine | yolo26n-pose.engine | ✅ | imgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device |
| CoreML | coreml | yolo26n-pose.mlpackage | ✅ | imgsz, dynamic, half, int8, nms, batch, device |
| TF SavedModel | saved_model | yolo26n-pose_saved_model/ | ✅ | imgsz, keras, int8, nms, batch, data, fraction, device |
| TF GraphDef | pb | yolo26n-pose.pb | ❌ | imgsz, batch, device |
| TF Lite | tflite | yolo26n-pose.tflite | ✅ | imgsz, half, int8, nms, batch, data, fraction, device |
| TF Edge TPU | edgetpu | yolo26n-pose_edgetpu.tflite | ✅ | imgsz, int8, data, fraction, device |
| TF.js | tfjs | yolo26n-pose_web_model/ | ✅ | imgsz, half, int8, nms, batch, data, fraction, device |
| PaddlePaddle | paddle | yolo26n-pose_paddle_model/ | ✅ | imgsz, batch, device |
| MNN | mnn | yolo26n-pose.mnn | ✅ | imgsz, batch, int8, half, device |
| NCNN | ncnn | yolo26n-pose_ncnn_model/ | ✅ | imgsz, half, batch, device |
| IMX500 | imx | yolo26n-pose_imx_model/ | ✅ | imgsz, int8, data, fraction, nms, device |
| RKNN | rknn | yolo26n-pose_rknn_model/ | ✅ | imgsz, batch, name, device |
| ExecuTorch | executorch | yolo26n-pose_executorch_model/ | ✅ | imgsz, batch, device |
| Axelera | axelera | yolo26n-pose_axelera_model/ | ✅ | imgsz, batch, int8, data, fraction, device |
| DeepX | deepx | yolo26n-pose_deepx_model/ | ✅ | imgsz, int8, data, optimize, device |
Vedi i dettagli completi su export nella pagina Esportazione.
FAQ
Cos'è la stima della posa con Ultralytics YOLO26 e come funziona?
La stima della posa con Ultralytics YOLO26 comporta l'identificazione di punti specifici, noti come keypoint, in un'immagine. Questi keypoint rappresentano solitamente articolazioni o altre caratteristiche importanti dell'oggetto. L'output include le coordinate [x, y] e i punteggi di confidenza per ogni punto. I modelli YOLO26-pose sono specificamente progettati per questo compito e utilizzano il suffisso -pose, come yolo26n-pose.pt. Questi modelli sono preaddestrati su dataset come COCO keypoints e possono essere utilizzati per varie attività di stima della posa. Per ulteriori informazioni, visita la Pagina sulla Stima della Posa.
Come posso addestrare un modello YOLO26-pose su un dataset personalizzato?
L'addestramento di un modello YOLO26-pose su un dataset personalizzato comporta il caricamento di un modello, che sia un nuovo modello definito da un file YAML o un modello preaddestrato. Puoi quindi avviare il processo di addestramento utilizzando il tuo dataset e i parametri specificati.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.yaml") # build a new model from YAML
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="your-dataset.yaml", epochs=100, imgsz=640)Per dettagli completi sull'addestramento, fai riferimento alla Sezione Train. Puoi anche utilizzare Ultralytics Platform per un approccio senza codice all'addestramento di modelli di stima della posa personalizzati.
Come convalido un modello YOLO26-pose addestrato?
La convalida di un modello YOLO26-pose comporta la valutazione della sua accuratezza utilizzando gli stessi parametri del dataset conservati durante l'addestramento. Ecco un esempio:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val() # no arguments needed, dataset and settings rememberedPer ulteriori informazioni, visita la Sezione Val.
Posso esportare un modello YOLO26-pose in altri formati, e come?
Sì, puoi esportare un modello YOLO26-pose in vari formati come ONNX, CoreML, TensorRT e altri. Questo può essere fatto utilizzando Python o l'interfaccia a riga di comando (CLI).
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom-trained model
# Export the model
model.export(format="onnx")Fai riferimento alla Sezione Export per ulteriori dettagli. I modelli esportati possono essere distribuiti su dispositivi edge per applicazioni in tempo reale come il monitoraggio del fitness, l'analisi sportiva o la robotica.
Quali sono i modelli Ultralytics YOLO26-pose disponibili e le loro metriche di performance?
Ultralytics YOLO26 offre vari modelli di posa preaddestrati come YOLO26n-pose, YOLO26s-pose, YOLO26m-pose, tra gli altri. Questi modelli differiscono per dimensioni, accuratezza (mAP) e velocità. Ad esempio, il modello YOLO26n-pose raggiunge un mAPpose50-95 di 50.0 e un mAPpose50 di 81.0. Per un elenco completo e dettagli sulle performance, visita la Sezione Models.