Dataset Dog-Pose
Introduzione
Il dataset Ultralytics Dog-Pose è un dataset esteso e di alta qualità, curato specificamente per la stima dei keypoint dei cani. Con 6.773 immagini di addestramento e 1.703 immagini di test, questo dataset fornisce una solida base per l'addestramento di modelli di stima della posa robusti.
Guarda: Come addestrare Ultralytics YOLO11 dataset Stanford Dog Pose Estimation | Tutorial passo dopo passo
Ogni immagine annotata include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), rendendola una risorsa preziosa per la ricerca e lo sviluppo avanzati nella computer vision.

Questo dataset è destinato all'uso con Ultralytics HUB e YOLO11.
Struttura del set di dati
- Divisione: 6.773 immagini di training / 1.703 immagini di test con file di etichette in formato YOLO corrispondenti.
- Punti chiave: 24 per cane con
(x, y, visibility)terzine. Layout:
datasets/dog-pose/ ├── images/{train,test} └── labels/{train,test}
YAML del set di dati
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Include percorsi, dettagli sui punti chiave e altre informazioni rilevanti. Nel caso del dataset Dog-pose, il dog-pose.yaml è disponibile su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilizzo
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Immagini di esempio e annotazioni
Ecco alcuni esempi di immagini del dataset Dog-pose, insieme alle relative annotazioni:

- Immagine mosaicata: questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicato. Il mosaicing è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e contesti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset Dog-pose e i vantaggi dell'utilizzo del mosaicing durante il processo di training.
Citazioni e ringraziamenti
Se utilizzi il dataset Dog-pose nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Desideriamo ringraziare il team di Stanford per aver creato e mantenuto questa preziosa risorsa per la comunità della computer vision. Per maggiori informazioni sul dataset Dog-pose e sui suoi creatori, visitare il sito web del dataset Stanford Dogs.
FAQ
Cos'è il dataset Dog-pose e come viene utilizzato con Ultralytics YOLO11?
Il dataset Dog-Pose presenta 6.773 immagini di addestramento e 1.703 immagini di test annotate con 24 keypoint per la stima della posa del cane. È progettato per l'addestramento e la convalida di modelli con Ultralytics YOLO11, supportando applicazioni come l'analisi del comportamento degli animali, il monitoraggio degli animali domestici e gli studi veterinari. Le annotazioni complete del dataset lo rendono ideale per lo sviluppo di modelli accurati di stima della posa per i canidi.
Come posso addestrare un modello YOLO11 utilizzando il dataset Dog-pose in Ultralytics?
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, segui questi esempi:
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Per un elenco completo degli argomenti di addestramento, fare riferimento alla pagina Addestramento del modello.
Quali sono i vantaggi dell'utilizzo del set di dati Dog-pose?
Il dataset Dog-pose offre diversi vantaggi:
Set di dati ampio e diversificato: Con oltre 8.400 immagini, fornisce dati sostanziali che coprono un'ampia gamma di pose, razze e contesti di cani, consentendo un robusto addestramento e valutazione del modello.
Detailed Keypoint Annotations: Ogni immagine include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), offrendo annotazioni precise per l'addestramento di modelli accurati di rilevamento della posa.
Scenari reali: Include immagini provenienti da ambienti diversi, migliorando la capacità del modello di generalizzare ad applicazioni del mondo reale come il monitoraggio degli animali domestici e l'analisi del comportamento.
Vantaggio dell'apprendimento trasferito: il set di dati funziona bene con le tecniche di apprendimento trasferito, consentendo ai modelli preaddestrati su set di dati relativi alle posture umane di adattarsi alle caratteristiche specifiche dei cani.
Per maggiori informazioni sulle sue caratteristiche e sul suo utilizzo, consulta la sezione Introduzione al dataset.
In che modo il mosaicing avvantaggia il processo di training di YOLO11 utilizzando il dataset Dog-pose?
Il mosaicing, come illustrato nelle sample_images del dataset Dog-pose, unisce più immagini in un unico composito, arricchendo la diversità di oggetti e scene in ogni batch di addestramento. Questa tecnica offre diversi vantaggi:
- Aumenta la varietà di pose, dimensioni e sfondi dei cani in ogni batch
- Migliora la capacità del modello di detectare cani in diversi contesti e scale
- Migliora la generalizzazione esponendo il modello a modelli visivi più diversi
- Riduce l'overfitting creando nuove combinazioni di esempi di training
Questo approccio porta a modelli più robusti che funzionano meglio in scenari reali. Per esempi di immagini, fare riferimento alla sezione Esempi di immagini e annotazioni.
Dove posso trovare il file YAML del dataset Dog-pose e come posso utilizzarlo?
Il file YAML del dataset Dog-pose è disponibile all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Questo file definisce la configurazione del dataset, inclusi percorsi, classi, dettagli dei keypoint e altre informazioni rilevanti. Il file YAML specifica 24 keypoint con 3 dimensioni per keypoint, rendendolo adatto per attività dettagliate di stima della posa.
Per utilizzare questo file con gli script di training YOLO11, è sufficiente farvi riferimento nel comando di training come mostrato nella sezione Utilizzo. Il dataset verrà scaricato automaticamente al primo utilizzo, rendendo la configurazione semplice.
Per ulteriori domande frequenti e documentazione dettagliata, visita la Documentazione Ultralytics.