Dataset Tiger-Pose
Introduzione
Ultralytics presenta il dataset Tiger-Pose, una raccolta versatile progettata per attività di pose estimation. Questo dataset comprende 263 immagini provenienti da un video di YouTube, con 210 immagini destinate all'addestramento e 53 alla validazione. Rappresenta un'eccellente risorsa per testare e risolvere problemi di algoritmi di pose estimation.
Nonostante il suo split di addestramento gestibile di 210 immagini, il dataset Tiger-Pose offre diversità, rendendolo adatto per valutare le pipeline di addestramento, identificare potenziali errori e fungere da prezioso passaggio preliminare prima di lavorare con dataset più ampi per la pose estimation.
Questo dataset è inteso per l'uso con Ultralytics Platform e YOLO26.
Struttura del dataset
- Immagini totali: 263 (210 train / 53 val).
- Keypoints: 12 per tigre (nessun flag di visibilità).
- Layout della directory: keypoint in formato YOLO memorizzati in
labels/{train,val}insieme alle directoryimages/{train,val}.
Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform
YAML del dataset
Un file YAML (Yet Another Markup Language) funge da mezzo per specificare i dettagli di configurazione di un dataset. Include dati cruciali come percorsi dei file, definizioni delle classi e altre informazioni pertinenti. Nello specifico, per il file tiger-pose.yaml, puoi consultare il File di configurazione del dataset Tiger-Pose di Ultralytics.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Keypoint names per class
kpt_names:
0:
- nose
- head
- withers
- tail_base
- right_hind_hock
- right_hind_paw
- left_hind_paw
- left_hind_hock
- right_front_wrist
- right_front_paw
- left_front_wrist
- left_front_paw
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zipUtilizzo
Per addestrare un modello YOLO26n-pose sul dataset Tiger-Pose per 100 epochs con una dimensione immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Immagini campione e annotazioni
Ecco alcuni esempi di immagini dal dataset Tiger-Pose, insieme alle relative annotazioni:
- Immagine a mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset a mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset Tiger-Pose e i vantaggi dell'utilizzo del mosaicing durante il processo di addestramento.
Esempio di inferenza
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Citazioni e ringraziamenti
Il dataset è stato rilasciato sotto Licenza AGPL-3.0.
FAQ
A cosa serve il dataset Tiger-Pose di Ultralytics?
Il dataset Tiger-Pose di Ultralytics è progettato per attività di pose estimation e consiste in 263 immagini provenienti da un video di YouTube. Il dataset è suddiviso in 210 immagini di addestramento e 53 immagini di validazione. È particolarmente utile per testare, addestrare e perfezionare algoritmi di pose estimation utilizzando Ultralytics Platform e YOLO26.
Come posso addestrare un modello YOLO26 sul dataset Tiger-Pose?
Per addestrare un modello YOLO26n-pose sul dataset Tiger-Pose per 100 epoche con una dimensione immagine di 640, utilizza i seguenti frammenti di codice. Per maggiori dettagli, visita la pagina Training:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Quali configurazioni include il file tiger-pose.yaml?
Il file tiger-pose.yaml viene utilizzato per specificare i dettagli di configurazione del dataset Tiger-Pose. Include dati cruciali come percorsi dei file e definizioni delle classi. Per vedere la configurazione esatta, puoi dare un'occhiata al File di configurazione del dataset Tiger-Pose di Ultralytics.
Come posso eseguire l'inferenza utilizzando un modello YOLO26 addestrato sul dataset Tiger-Pose?
Per eseguire l'inferenza utilizzando un modello YOLO26 addestrato sul dataset Tiger-Pose, puoi utilizzare i seguenti frammenti di codice. Per una guida dettagliata, visita la pagina Prediction:
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Quali sono i vantaggi dell'utilizzo del dataset Tiger-Pose per la pose estimation?
Il dataset Tiger-Pose, nonostante le dimensioni gestibili di 210 immagini per l'addestramento, fornisce una raccolta diversificata di immagini ideali per testare le pipeline di pose estimation. Il dataset aiuta a identificare potenziali errori e funge da passaggio preliminare prima di lavorare con dataset più ampi. Inoltre, il dataset supporta l'addestramento e il perfezionamento di algoritmi di pose estimation utilizzando strumenti avanzati come Ultralytics Platform e YOLO26, migliorando le prestazioni del modello e l'accuratezza.