Set di dati sulla posa del cane
Introduzione
Il set di dati Ultralytics Dog-pose è un set di dati ampio e di alta qualità, appositamente studiato per la stima dei punti chiave dei cani. Con 6.773 immagini di addestramento e 1.703 immagini di test, questo dataset fornisce una solida base per l'addestramento di robusti modelli di stima della posa. Ogni immagine annotata comprende 24 keypoint con 3 dimensioni per keypoint (x, y, visibilità), il che lo rende una risorsa preziosa per la ricerca avanzata e lo sviluppo nella computer vision.
Questo set di dati è destinato all'utilizzo di Ultralytics HUB e di YOLO11.
Set di dati YAML
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del set di dati. Include percorsi, dettagli dei punti chiave e altre informazioni rilevanti. Nel caso del set di dati Dog-pose, il file dog-pose.yaml
è disponibile all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilizzo
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con una dimensione dell'immagine di 640, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.
Esempio di treno
Immagini di esempio e annotazioni
Ecco alcuni esempi di immagini tratte dal dataset Dog-pose, con le relative annotazioni:
- Immagine a mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicate. La mosaicatura è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ciascun batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti di aspetto e contesti diversi.
L'esempio mostra la varietà e la complessità delle immagini del dataset Dog-pose e i vantaggi dell'uso della mosaicatura durante il processo di addestramento.
Citazioni e ringraziamenti
Se utilizzate il dataset Dog-pose nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Desideriamo ringraziare il team di Stanford per aver creato e mantenuto questa preziosa risorsa per la comunità della computer vision. Per ulteriori informazioni sul dataset Dog-pose e sui suoi creatori, visitare il sito web Stanford Dogs Dataset.
FAQ
Che cos'è il dataset Dog-pose e come si usa con Ultralytics YOLO11 ?
Il dataset Dog-Pose contiene 6.773 immagini di addestramento e 1.703 immagini di test annotate con 24 punti chiave per la stima della posa del cane. È stato progettato per l'addestramento e la validazione dei modelli con Ultralytics YOLO11a supporto di applicazioni come l'analisi del comportamento animale, il monitoraggio degli animali domestici e gli studi veterinari. Le annotazioni complete del dataset lo rendono ideale per lo sviluppo di modelli accurati di stima della posa per i canini.
Come si addestra un modello YOLO11 utilizzando il dataset Dog-pose in Ultralytics?
Per addestrare un modello YOLO11n-pose sul dataset Dog-pose per 100 epoche con un'immagine di 640, seguire questi esempi:
Esempio di treno
Per un elenco completo degli argomenti di formazione, consultare la pagina Formazione del modello.
Quali sono i vantaggi dell'utilizzo del dataset Dog-pose?
Il set di dati Dog-pose offre diversi vantaggi:
Un set di dati ampio e diversificato: Con oltre 8.400 immagini, fornisce dati consistenti che coprono un'ampia gamma di pose, razze e contesti di cani, consentendo una solida formazione e valutazione dei modelli.
Annotazioni dettagliate dei punti chiave: Ogni immagine include 24 punti chiave con 3 dimensioni per punto chiave (x, y, visibilità), offrendo annotazioni precise per l'addestramento di modelli di rilevamento della posa accurati.
Scenari del mondo reale: Include immagini provenienti da ambienti diversi, migliorando la capacità del modello di generalizzarsi alle applicazioni del mondo reale, come il monitoraggio degli animali domestici e l'analisi del comportamento.
Vantaggio dell'apprendimento per trasferimento: Il set di dati funziona bene con le tecniche di transfer learning, consentendo ai modelli pre-addestrati su set di dati di pose umane di adattarsi alle caratteristiche specifiche dei cani.
Per ulteriori informazioni sulle sue caratteristiche e sul suo utilizzo, consultare la sezione Introduzione al dataset.
In che modo la mosaicatura può giovare al processo di addestramento di YOLO11 utilizzando il dataset Dog-pose?
La mosaicatura, come illustrato nelle immagini campione del set di dati Dog-pose, fonde più immagini in un unico composito, arricchendo la diversità di oggetti e scene in ogni gruppo di addestramento. Questa tecnica offre diversi vantaggi:
- Aumenta la varietà di pose, dimensioni e sfondi dei cani in ogni lotto.
- Migliora la capacità del modello di individuare i cani in contesti e scale diverse
- Migliora la generalizzazione esponendo il modello a modelli visivi più diversi.
- Riduce l'overfitting creando nuove combinazioni di esempi di addestramento.
Questo approccio porta a modelli più robusti che funzionano meglio in scenari reali. Per immagini di esempio, consultare la sezione Immagini di esempio e annotazioni.
Dove posso trovare il file YAML del dataset Dog-pose e come posso utilizzarlo?
Il file YAML del dataset Dog-pose si trova qui. Questo file definisce la configurazione del dataset, compresi i percorsi, le classi, i dettagli dei keypoint e altre informazioni rilevanti. Il file YAML specifica 24 punti chiave con 3 dimensioni per punto chiave, rendendolo adatto a compiti di stima dettagliata della posa.
Per utilizzare questo file con gli script di addestramento YOLO11 , è sufficiente fare riferimento ad esso nel comando di addestramento, come indicato nella sezione Uso. Il set di dati verrà scaricato automaticamente al primo utilizzo, rendendo semplice la configurazione.
Per ulteriori FAQ e documentazione dettagliata, visitate la Documentazione di Ultralytics .