Link to this sectionDataset Dog-Pose#

Link to this sectionIntroduzione#

Il dataset Ultralytics Dog-Pose è un dataset esteso e di alta qualità curato specificamente per la stima dei keypoint dei cani, che fornisce 6.773 immagini di addestramento e 1.703 di convalida.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Ogni immagine annotata include 24 punti chiave con 3 dimensioni per punto chiave (x, y, visibilità), rendendolo una risorsa preziosa per la ricerca avanzata e lo sviluppo nella computer vision.

Per una razza specifica o per un animale diverso, Ultralytics Platform gestisce il caricamento, l'etichettatura e l'addestramento di un modello di keypoint personalizzato sui tuoi dati senza dover gestire l'infrastruttura.

Link to this sectionStruttura del dataset#

Immagini totali: 8.476 (6.773 di addestramento / 1.703 di convalida) con file di etichetta in formato YOLO corrispondenti.
Keypoints: 24 per cane con triplette (x, y, visibility).
Dimensione download: ~337 MB.

Layout:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionDataset YAML#

Un file YAML viene utilizzato per definire la configurazione del dataset. Include percorsi, dettagli sui keypoint e altre informazioni rilevanti. Nel caso del dataset Dog-Pose, il file dog-pose.yaml è disponibile su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionUtilizzo#

Per addestrare un modello YOLO26n-pose sul dataset Dog-Pose per 100 epochs con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina Training del modello.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionEsempi di immagini e annotazioni#

Ecco alcuni esempi di immagini dal dataset Dog-Pose, insieme alle relative annotazioni:

Dog pose estimation dataset mosaic training batch

Immagine Mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset a mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.

L'esempio mostra la varietà e la complessità delle immagini nel dataset Dog-Pose e i vantaggi dell'utilizzo del mosaicing durante il processo di addestramento.

Link to this sectionCitazioni e riconoscimenti#

Se utilizzi il dataset Dog-Pose nella tua ricerca o nel tuo lavoro di sviluppo, cita il seguente articolo:

Citazione

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Vorremmo ringraziare il team di Stanford per aver creato e mantenuto questa risorsa preziosa per la comunità di computer vision. Per maggiori informazioni sul dataset Dog-Pose e sui suoi creatori, visita il sito web dello Stanford Dogs Dataset.

Link to this sectionFAQ#

Link to this sectionCos'è il dataset Dog-Pose e come viene utilizzato con Ultralytics YOLO26?#

Il dataset Dog-Pose contiene 6.773 immagini di addestramento e 1.703 di convalida annotate con 24 keypoint per la stima della posa dei cani. È progettato per addestrare e convalidare modelli con Ultralytics YOLO26, supportando applicazioni come l'analisi del comportamento animale, il monitoraggio degli animali domestici e studi veterinari. Le annotazioni complete del dataset lo rendono ideale per sviluppare modelli accurati di stima della posa per i canini.

Link to this sectionCome addestro un modello YOLO26 utilizzando il dataset Dog-Pose in Ultralytics?#

Carica yolo26n-pose.pt e chiama model.train(data="dog-pose.yaml", epochs=100, imgsz=640) — vedi l'Esempio di Addestramento sopra per i frammenti completi in Python e CLI, e la pagina di Training del modello per un elenco completo degli argomenti.

Link to this sectionQuali sono i vantaggi dell'utilizzo del dataset Dog-Pose?#

Con 8.476 immagini totali (6.773 di addestramento / 1.703 di convalida) che coprono un'ampia gamma di razze e pose canine, e 24 keypoint in 3 dimensioni (x, y, visibilità) per annotazione, il dataset Dog-Pose fornisce ai modelli la copertura di scenari reali necessaria per applicazioni come il monitoraggio degli animali domestici e l'analisi comportamentale. Per maggiori informazioni sulle sue funzionalità e sull'utilizzo, consulta la sezione Introduzione al Dataset.

Link to this sectionIn che modo il mosaicing avvantaggia il processo di addestramento di YOLO26 utilizzando il dataset Dog-Pose?#

Il mosaicing combina più immagini del Dog-Pose in un'unica immagine di addestramento, aumentando la varietà di pose, dimensioni e sfondi dei cani che il modello vede per ogni passaggio, il che migliora la generalizzazione a nuovi contesti e scale riducendo al contempo l'overfitting. Per immagini di esempio, fai riferimento alla sezione Immagini di Esempio e Annotazioni.

Link to this sectionDove posso trovare il file YAML del dataset Dog-Pose e come posso utilizzarlo?#

Il file YAML del dataset Dog-Pose può essere trovato su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Questo file definisce la configurazione del dataset, inclusi percorsi, classi, dettagli sui keypoint e altre informazioni rilevanti. Lo YAML specifica 24 keypoint con 3 dimensioni per keypoint, rendendolo adatto a compiti dettagliati di stima della posa.

Per utilizzare questo file con gli script di addestramento YOLO26, ti basta fare riferimento ad esso nel tuo comando di addestramento come mostrato nella sezione Utilizzo. Il dataset verrà scaricato automaticamente al primo utilizzo, rendendo la configurazione semplice.

Per saperne di più sui modelli di keypoint, consulta la documentazione sull'attività di Pose Estimation.

Collaboratori

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

Creato 16 nov 2024Aggiornato l’altro ieri