Dataset Dog-Pose
Introduzione
Il dataset Dog-pose di Ultralytics è un dataset di alta qualità ed esteso, specificamente curato per la stima dei keypoint dei cani. Con 6.773 immagini di addestramento e 1.703 immagini di test, questo dataset fornisce una solida base per l'addestramento di modelli robusti di stima della posa.
Guarda: Come addestrare Ultralytics YOLO11 sul dataset Stanford Dog Pose Estimation | Tutorial passo-passo 🚀
Ogni immagine annotata include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), rendendola una risorsa preziosa per la ricerca e lo sviluppo avanzati nella computer vision.
Questo dataset è destinato all'uso con Ultralytics HUB e YOLO11.
YAML del set di dati
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Include percorsi, dettagli sui punti chiave e altre informazioni rilevanti. Nel caso del dataset Dog-pose, il dog-pose.yaml
è disponibile su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilizzo
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Immagini di esempio e annotazioni
Ecco alcuni esempi di immagini del dataset Dog-pose, insieme alle relative annotazioni:
- Immagine mosaicata: questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicato. Il mosaicing è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e contesti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset Dog-pose e i vantaggi dell'utilizzo del mosaicing durante il processo di training.
Citazioni e ringraziamenti
Se utilizzi il dataset Dog-pose nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Desideriamo ringraziare il team di Stanford per aver creato e mantenuto questa preziosa risorsa per la comunità della computer vision. Per maggiori informazioni sul dataset Dog-pose e sui suoi creatori, visitare il sito web del dataset Stanford Dogs.
FAQ
Cos'è il dataset Dog-pose e come viene utilizzato con Ultralytics YOLO11?
Il dataset Dog-Pose presenta 6.773 immagini di addestramento e 1.703 immagini di test annotate con 24 keypoint per la stima della posa del cane. È progettato per l'addestramento e la convalida di modelli con Ultralytics YOLO11, supportando applicazioni come l'analisi del comportamento degli animali, il monitoraggio degli animali domestici e gli studi veterinari. Le annotazioni complete del dataset lo rendono ideale per lo sviluppo di modelli accurati di stima della posa per i canidi.
Come posso addestrare un modello YOLO11 utilizzando il dataset Dog-pose in Ultralytics?
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, segui questi esempi:
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Per un elenco completo degli argomenti di addestramento, fare riferimento alla pagina Addestramento del modello.
Quali sono i vantaggi dell'utilizzo del set di dati Dog-pose?
Il dataset Dog-pose offre diversi vantaggi:
Set di dati ampio e diversificato: Con oltre 8.400 immagini, fornisce dati sostanziali che coprono un'ampia gamma di pose, razze e contesti di cani, consentendo un robusto addestramento e valutazione del modello.
Detailed Keypoint Annotations: Ogni immagine include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), offrendo annotazioni precise per l'addestramento di modelli accurati di rilevamento della posa.
Scenari reali: Include immagini provenienti da ambienti diversi, migliorando la capacità del modello di generalizzare ad applicazioni del mondo reale come il monitoraggio degli animali domestici e l'analisi del comportamento.
Vantaggio dell'apprendimento transfer: Il dataset funziona bene con le tecniche di transfer learning, consentendo ai modelli pre-addestrati su dataset di pose umane di adattarsi alle caratteristiche specifiche del cane.
Per maggiori informazioni sulle sue caratteristiche e sul suo utilizzo, consulta la sezione Introduzione al dataset.
In che modo il mosaicing avvantaggia il processo di training di YOLO11 utilizzando il dataset Dog-pose?
Il mosaicing, come illustrato nelle sample_images del dataset Dog-pose, unisce più immagini in un unico composito, arricchendo la diversità di oggetti e scene in ogni batch di addestramento. Questa tecnica offre diversi vantaggi:
- Aumenta la varietà di pose, dimensioni e sfondi dei cani in ogni batch
- Migliora la capacità del modello di rilevare cani in diversi contesti e scale
- Migliora la generalizzazione esponendo il modello a modelli visivi più diversi
- Riduce l'overfitting creando nuove combinazioni di esempi di training
Questo approccio porta a modelli più robusti che funzionano meglio in scenari reali. Per esempi di immagini, fare riferimento alla sezione Esempi di immagini e annotazioni.
Dove posso trovare il file YAML del dataset Dog-pose e come posso utilizzarlo?
Il file YAML del dataset Dog-pose è disponibile all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Questo file definisce la configurazione del dataset, inclusi percorsi, classi, dettagli dei keypoint e altre informazioni rilevanti. Il file YAML specifica 24 keypoint con 3 dimensioni per keypoint, rendendolo adatto per attività dettagliate di stima della posa.
Per utilizzare questo file con gli script di training YOLO11, è sufficiente farvi riferimento nel comando di training come mostrato nella sezione Utilizzo. Il dataset verrà scaricato automaticamente al primo utilizzo, rendendo la configurazione semplice.
Per ulteriori domande frequenti e documentazione dettagliata, visita la Documentazione Ultralytics.