Vai al contenuto

Dataset Dog-Pose

Introduzione

Il dataset Dog-pose di Ultralytics è un dataset di alta qualità ed esteso, specificamente curato per la stima dei keypoint dei cani. Con 6.773 immagini di addestramento e 1.703 immagini di test, questo dataset fornisce una solida base per l'addestramento di modelli robusti di stima della posa.



Guarda: Come addestrare Ultralytics YOLO11 sul dataset Stanford Dog Pose Estimation | Tutorial passo-passo 🚀

Ogni immagine annotata include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), rendendola una risorsa preziosa per la ricerca e lo sviluppo avanzati nella computer vision.

Immagine di visualizzazione Dog-pose di Ultralytics

Questo dataset è destinato all'uso con Ultralytics HUB e YOLO11.

YAML del set di dati

Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Include percorsi, dettagli sui punti chiave e altre informazioni rilevanti. Nel caso del dataset Dog-pose, il dog-pose.yaml è disponibile su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilizzo

Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Immagini di esempio e annotazioni

Ecco alcuni esempi di immagini del dataset Dog-pose, insieme alle relative annotazioni:

Immagine di esempio del set di dati

  • Immagine mosaicata: questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicato. Il mosaicing è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e contesti.

L'esempio mostra la varietà e la complessità delle immagini nel dataset Dog-pose e i vantaggi dell'utilizzo del mosaicing durante il processo di training.

Citazioni e ringraziamenti

Se utilizzi il dataset Dog-pose nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Desideriamo ringraziare il team di Stanford per aver creato e mantenuto questa preziosa risorsa per la comunità della computer vision. Per maggiori informazioni sul dataset Dog-pose e sui suoi creatori, visitare il sito web del dataset Stanford Dogs.

FAQ

Cos'è il dataset Dog-pose e come viene utilizzato con Ultralytics YOLO11?

Il dataset Dog-Pose presenta 6.773 immagini di addestramento e 1.703 immagini di test annotate con 24 keypoint per la stima della posa del cane. È progettato per l'addestramento e la convalida di modelli con Ultralytics YOLO11, supportando applicazioni come l'analisi del comportamento degli animali, il monitoraggio degli animali domestici e gli studi veterinari. Le annotazioni complete del dataset lo rendono ideale per lo sviluppo di modelli accurati di stima della posa per i canidi.

Come posso addestrare un modello YOLO11 utilizzando il dataset Dog-pose in Ultralytics?

Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, segui questi esempi:

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Per un elenco completo degli argomenti di addestramento, fare riferimento alla pagina Addestramento del modello.

Quali sono i vantaggi dell'utilizzo del set di dati Dog-pose?

Il dataset Dog-pose offre diversi vantaggi:

Set di dati ampio e diversificato: Con oltre 8.400 immagini, fornisce dati sostanziali che coprono un'ampia gamma di pose, razze e contesti di cani, consentendo un robusto addestramento e valutazione del modello.

Detailed Keypoint Annotations: Ogni immagine include 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), offrendo annotazioni precise per l'addestramento di modelli accurati di rilevamento della posa.

Scenari reali: Include immagini provenienti da ambienti diversi, migliorando la capacità del modello di generalizzare ad applicazioni del mondo reale come il monitoraggio degli animali domestici e l'analisi del comportamento.

Vantaggio dell'apprendimento transfer: Il dataset funziona bene con le tecniche di transfer learning, consentendo ai modelli pre-addestrati su dataset di pose umane di adattarsi alle caratteristiche specifiche del cane.

Per maggiori informazioni sulle sue caratteristiche e sul suo utilizzo, consulta la sezione Introduzione al dataset.

In che modo il mosaicing avvantaggia il processo di training di YOLO11 utilizzando il dataset Dog-pose?

Il mosaicing, come illustrato nelle sample_images del dataset Dog-pose, unisce più immagini in un unico composito, arricchendo la diversità di oggetti e scene in ogni batch di addestramento. Questa tecnica offre diversi vantaggi:

  • Aumenta la varietà di pose, dimensioni e sfondi dei cani in ogni batch
  • Migliora la capacità del modello di rilevare cani in diversi contesti e scale
  • Migliora la generalizzazione esponendo il modello a modelli visivi più diversi
  • Riduce l'overfitting creando nuove combinazioni di esempi di training

Questo approccio porta a modelli più robusti che funzionano meglio in scenari reali. Per esempi di immagini, fare riferimento alla sezione Esempi di immagini e annotazioni.

Dove posso trovare il file YAML del dataset Dog-pose e come posso utilizzarlo?

Il file YAML del dataset Dog-pose è disponibile all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Questo file definisce la configurazione del dataset, inclusi percorsi, classi, dettagli dei keypoint e altre informazioni rilevanti. Il file YAML specifica 24 keypoint con 3 dimensioni per keypoint, rendendolo adatto per attività dettagliate di stima della posa.

Per utilizzare questo file con gli script di training YOLO11, è sufficiente farvi riferimento nel comando di training come mostrato nella sezione Utilizzo. Il dataset verrà scaricato automaticamente al primo utilizzo, rendendo la configurazione semplice.

Per ulteriori domande frequenti e documentazione dettagliata, visita la Documentazione Ultralytics.



📅 Creato 9 mesi fa ✏️ Aggiornato 2 mesi fa

Commenti