Link to this sectionDataset Dog-Pose#
Link to this sectionIntroduzione#
Il dataset Dog-Pose di Ultralytics è un dataset esteso e di alta qualità, curato specificamente per la stima dei punti chiave (keypoint) dei cani. Con 6.773 immagini di training e 1.703 immagini di test, questo dataset fornisce una solida base per addestrare modelli robusti di stima della posa.
Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial
Ogni immagine annotata include 24 punti chiave con 3 dimensioni per punto chiave (x, y, visibilità), rendendolo una risorsa preziosa per la ricerca avanzata e lo sviluppo nella computer vision.
Questo dataset è inteso per l'uso con Ultralytics Platform e YOLO26.
Link to this sectionStruttura del dataset#
-
Split: 6.773 immagini di training / 1.703 di validazione con file di etichette corrispondenti nel formato YOLO.
-
Keypoints: 24 per dog with
(x, y, visibility)triplets. -
Layout:
datasets/dog-pose/ ├── images/{train,val} └── labels/{train,val}
Link to this sectionDataset YAML#
Viene utilizzato un file YAML (Yet Another Markup Language) per definire la configurazione del dataset. Include percorsi, dettagli sui punti chiave e altre informazioni rilevanti. Nel caso del dataset Dog-pose, il file dog-pose.yaml è disponibile su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zipLink to this sectionUtilizzo#
Per addestrare un modello YOLO26n-pose sul dataset Dog-pose per 100 epoch con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di Addestramento del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Link to this sectionEsempi di immagini e annotazioni#
Ecco alcuni esempi di immagini dal dataset Dog-pose, insieme alle loro annotazioni corrispondenti:
- Immagine Mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset a mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset Dog-pose e i vantaggi dell'utilizzo del mosaicing durante il processo di addestramento.
Link to this sectionCitazioni e riconoscimenti#
Se utilizzi il dataset Dog-pose nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}Desideriamo ringraziare il team di Stanford per aver creato e mantenuto questa risorsa preziosa per la comunità della computer vision. Per ulteriori informazioni sul dataset Dog-pose e i suoi creatori, visita il sito web dello Stanford Dogs Dataset.
Link to this sectionFAQ#
Link to this sectionCos'è il dataset Dog-pose e come viene utilizzato con Ultralytics YOLO26?#
Il dataset Dog-Pose contiene 6.773 immagini di training e 1.703 di test annotate con 24 punti chiave per la stima della posa del cane. È progettato per l'addestramento e la validazione di modelli con Ultralytics YOLO26, supportando applicazioni come l'analisi del comportamento animale, il monitoraggio degli animali domestici e studi veterinari. Le annotazioni complete del dataset lo rendono ideale per sviluppare modelli accurati di stima della posa per i canini.
Link to this sectionCome posso addestrare un modello YOLO26 utilizzando il dataset Dog-pose in Ultralytics?#
Per addestrare un modello YOLO26n-pose sul dataset Dog-pose per 100 epoch con una dimensione dell'immagine di 640, segui questi esempi:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Per un elenco completo degli argomenti di addestramento, consulta la pagina di Addestramento del modello.
Link to this sectionQuali sono i vantaggi dell'utilizzo del dataset Dog-pose?#
Il dataset Dog-pose offre diversi vantaggi:
Dataset ampio e diversificato: Con oltre 8.400 immagini, fornisce dati sostanziali che coprono una vasta gamma di pose, razze e contesti canini, consentendo un addestramento e una valutazione robusti del modello.
Annotazioni dettagliate dei punti chiave: Ogni immagine include 24 punti chiave con 3 dimensioni per punto chiave (x, y, visibilità), offrendo annotazioni precise per l'addestramento di modelli accurati di rilevamento della posa.
Scenari del mondo reale: Include immagini provenienti da ambienti vari, migliorando la capacità del modello di generalizzare ad applicazioni del mondo reale come il monitoraggio degli animali domestici e l'analisi del comportamento.
Vantaggio del transfer learning: Il dataset funziona bene con le tecniche di transfer learning, consentendo ai modelli pre-addestrati su dataset di posa umana di adattarsi alle caratteristiche specifiche dei cani.
Per ulteriori informazioni sulle sue funzionalità e sull'utilizzo, consulta la sezione Introduzione al dataset.
Link to this sectionIn che modo il mosaicing avvantaggia il processo di addestramento YOLO26 utilizzando il dataset Dog-pose?#
Il mosaicing, come illustrato nelle immagini di esempio del dataset Dog-pose, unisce più immagini in un unico composito, arricchendo la diversità di oggetti e scene in ogni batch di addestramento. Questa tecnica offre diversi vantaggi:
- Aumenta la varietà di pose, dimensioni e sfondi dei cani in ogni batch
- Migliora la capacità del modello di rilevare i cani in diversi contesti e scale
- Migliora la generalizzazione esponendo il modello a pattern visivi più diversificati
- Riduce l'overfitting creando nuove combinazioni di esempi di addestramento
Questo approccio porta a modelli più robusti che hanno prestazioni migliori negli scenari del mondo reale. Per immagini di esempio, consulta la sezione Immagini di esempio e annotazioni.
Link to this sectionDove posso trovare il file YAML del dataset Dog-pose e come lo utilizzo?#
Il file YAML del dataset Dog-pose si trova su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Questo file definisce la configurazione del dataset, inclusi percorsi, classi, dettagli sui punti chiave e altre informazioni rilevanti. Lo YAML specifica 24 punti chiave con 3 dimensioni per punto chiave, rendendolo adatto a compiti dettagliati di stima della posa.
Per utilizzare questo file con gli script di addestramento YOLO26, ti basta fare riferimento ad esso nel tuo comando di addestramento come mostrato nella sezione Utilizzo. Il dataset verrà scaricato automaticamente al primo utilizzo, rendendo la configurazione semplice.
Per ulteriori FAQ e documentazione dettagliata, visita la Documentazione di Ultralytics.