Link to this sectionDataset Tiger-Pose#

Name: Dataset di Stima della Posa Tiger-Pose
Creator: Ultralytics
License: https://www.ultralytics.com/license
Keywords: Ultralytics, Tiger-Pose, dataset, stima della posa, YOLO26, dati di training, machine learning, reti neurali

Link to this sectionIntroduzione#

Ultralytics introduce il dataset Tiger-Pose, una raccolta versatile progettata per attività di stima della posa. Questo dataset comprende 263 immagini tratte da un video di YouTube, con 210 immagini destinate all'addestramento e 53 alla validazione. Rappresenta un'eccellente risorsa per testare e risolvere problemi degli algoritmi di stima della posa.

Nonostante il suo split di addestramento gestibile di 210 immagini, il dataset Tiger-Pose offre diversità, rendendolo adatto per valutare le pipeline di addestramento, identificare potenziali errori e fungere da utile passaggio preliminare prima di lavorare con dataset più ampi per la pose estimation.

Una volta che la tua pipeline è stata addestrata correttamente su questo piccolo set, sostituisci i keypoint con i tuoi animali o oggetti e aumenta la scala dell'addestramento su Ultralytics Platform senza mai uscire dal browser.

Link to this sectionStruttura del dataset#

Immagini totali: 263 (210 train / 53 val).
Keypoints: 12 per tigre (nessun flag di visibilità).
Dimensione download: ~49.8 MB.
Layout della directory: Keypoint in formato YOLO memorizzati sotto labels/{train,val} insieme alle directory images/{train,val}.

Watch: Train an Ultralytics YOLO Pose Model on the Tiger-Pose Dataset

Link to this sectionDataset YAML#

Un file YAML serve come mezzo per specificare i dettagli di configurazione di un dataset. Contiene dati cruciali come percorsi dei file, definizioni delle classi e altre informazioni pertinenti. Nello specifico, per il file tiger-pose.yaml, puoi consultare il File di configurazione del dataset Tiger-Pose di Ultralytics.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Link to this sectionUtilizzo#

Per addestrare un modello YOLO26n-pose sul dataset Tiger-Pose per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Addestramento del modello.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Link to this sectionEsempi di immagini e annotazioni#

Ecco alcuni esempi di immagini dal dataset Tiger-Pose, insieme alle relative annotazioni:

Tiger pose estimation dataset mosaic training batch

Immagine Mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset a mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.

L'esempio mostra la varietà e la complessità delle immagini nel dataset Tiger-Pose e i vantaggi dell'utilizzo del mosaico durante il processo di addestramento.

Link to this sectionEsempio di inferenza#

Dopo l'addestramento, carica il tuo miglior checkpoint ed esegui l'inferenza su nuove immagini o video — consulta la pagina Prediction per l'elenco completo degli argomenti.

Esempio di inferenza

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Link to this sectionCitazioni e riconoscimenti#

Ultralytics rilascia le annotazioni del dataset Tiger-Pose sotto la AGPL-3.0 License. Il video sorgente rimane soggetto ai suoi termini originali, che dovresti consultare prima di utilizzare o ridistribuire i fotogrammi estratti.

Link to this sectionFAQ#

Link to this sectionA cosa serve il dataset Tiger-Pose di Ultralytics?#

Il dataset Ultralytics Tiger-Pose è progettato per attività di stima della posa e consiste in 263 immagini provenienti da un video di YouTube. Il dataset è diviso in 210 immagini di addestramento e 53 immagini di validazione, il che lo rende ideale per testare, addestrare e perfezionare gli algoritmi di stima della posa.

Link to this sectionCome posso addestrare un modello YOLO26 sul dataset Tiger-Pose?#

Carica yolo26n-pose.pt e chiama model.train(data="tiger-pose.yaml", epochs=100, imgsz=640) — consulta l' Esempio di Addestramento qui sopra per gli snippet completi in Python e CLI, e la pagina Training per un elenco completo degli argomenti.

Link to this sectionQuali configurazioni include il file `tiger-pose.yaml`?#

Il file tiger-pose.yaml definisce il percorso del dataset, le directory per le immagini di addestramento/validazione, una singola classe (tiger) e kpt_shape: [12, 2] — 12 keypoint per istanza senza flag di visibilità. Consulta il File di Configurazione del Dataset Ultralytics Tiger-Pose per la configurazione esatta.

Link to this sectionCome posso eseguire l'inferenza utilizzando un modello YOLO26 addestrato sul dataset Tiger-Pose?#

Carica il tuo checkpoint addestrato (ad esempio, path/to/best.pt) e chiama model.predict(source=..., show=True) — consulta l' Esempio di Inferenza qui sopra per gli snippet completi in Python e CLI, e la pagina Prediction per un elenco completo degli argomenti.

Link to this sectionQuali sono i vantaggi dell'utilizzo del dataset Tiger-Pose per la stima della posa?#

Con 263 immagini totali (210 di training / 53 di val), 1 classe, 12 keypoint per istanza e un download di ~49.8 MB, Tiger-Pose è abbastanza piccolo da essere gestito rapidamente ma abbastanza diversificato da verificare la validità di una pipeline di addestramento della posa e identificare errori prima di lavorare con dataset più grandi.

Collaboratori

GLglenn-jocher²⁰ RAraimbekovm³ HIhim2him2¹ MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹ LUlunarifish¹

Creato 12 nov 2023Aggiornato 3 giorni fa