Conjunto de datos Dog-Pose
Introducción
La base de datos Ultralytics Dog-pose dataset es un amplio conjunto de datos de alta calidad creado específicamente para la estimación de puntos clave de perros. Con 6.773 imágenes de entrenamiento y 1.703 imágenes de prueba, este conjunto de datos proporciona una base sólida para el entrenamiento de modelos robustos de estimación de poses. Cada imagen anotada incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que la convierte en un valioso recurso para la investigación y el desarrollo avanzados en visión por ordenador.
Este conjunto de datos está pensado para su uso con Ultralytics HUB y YOLO11.
Conjunto de datos YAML
Para definir la configuración del conjunto de datos se utiliza un archivo YAML (Yet Another Markup Language). Incluye rutas, detalles de los puntos clave y otra información relevante. En el caso del conjunto de datos Dog-pose, el archivo dog-pose.yaml
está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilización
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.
Ejemplo de tren
Ejemplos de imágenes y anotaciones
He aquí algunos ejemplos de imágenes del conjunto de datos Dog-pose, junto con sus correspondientes anotaciones:
- Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos Dog-pose y las ventajas de utilizar mosaicos durante el proceso de entrenamiento.
Citas y agradecimientos
Si utiliza el conjunto de datos Dog-pose en su trabajo de investigación o desarrollo, cite el siguiente documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Queremos agradecer al equipo de Stanford la creación y el mantenimiento de este valioso recurso para la comunidad de visión por ordenador. Para más información sobre el conjunto de datos Dog-pose y sus creadores, visite el sitio web Stanford Dogs Dataset.
PREGUNTAS FRECUENTES
¿Qué es el conjunto de datos Dog-pose y cómo se utiliza con Ultralytics YOLO11 ?
El conjunto de datos Dog-Pose contiene 6.000 imágenes anotadas con 17 puntos clave para la estimación de la postura de los perros. Ideal para entrenar y validar modelos con Ultralytics YOLO11para aplicaciones como el análisis del comportamiento animal y los estudios veterinarios.
¿Cómo entreno un modelo YOLO11 utilizando el conjunto de datos Dog-pose en Ultralytics?
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, siga estos ejemplos:
Ejemplo de tren
Para obtener una lista completa de los argumentos de formación, consulte la página de formación del modelo.
¿Cuáles son las ventajas de utilizar el conjunto de datos Dog-pose?
El conjunto de datos Dog-pose ofrece varias ventajas:
Conjunto de datos amplio y diverso: Con 6.000 imágenes, proporciona una cantidad considerable de datos que abarcan una amplia gama de poses, razas y contextos caninos, lo que permite un sólido entrenamiento y evaluación de modelos.
Anotaciones específicas de pose: Ofrece anotaciones detalladas para la estimación de poses, lo que garantiza datos de alta calidad para el entrenamiento de modelos de detección de poses.
Escenarios del mundo real: Incluye imágenes de entornos variados, lo que mejora la capacidad del modelo para generalizarse a aplicaciones del mundo real.
Mejora del rendimiento del modelo: La diversidad y la escala del conjunto de datos ayudan a mejorar la precisión y la solidez del modelo, sobre todo en tareas que implican una estimación de la pose muy precisa.
Para más información sobre sus características y uso, consulte la sección Introducción al conjunto de datos.
¿En qué beneficia el mosaico al proceso de formación YOLO11 utilizando el conjunto de datos Dog-pose?
El mosaico, como se ilustra en las imágenes de muestra del conjunto de datos Dog-pose, fusiona varias imágenes en una sola compuesta, enriqueciendo la diversidad de objetos y escenas en cada lote de entrenamiento. Este enfoque mejora la capacidad del modelo para generalizar a través de diferentes tamaños de objetos, relaciones de aspecto y contextos, lo que conduce a un mejor rendimiento. Para ver imágenes de ejemplo, consulte la sección Imágenes de muestra y anotaciones.
¿Dónde puedo encontrar el archivo YAML del conjunto de datos Dog-pose y cómo puedo utilizarlo?
El archivo YAML del conjunto de datos Dog-pose se encuentra aquí. Este archivo define la configuración del conjunto de datos, incluyendo rutas, clases y otra información relevante. Utilice este archivo con los scripts de entrenamiento de YOLO11 como se menciona en la sección Ejemplo de entrenamiento.
Para más preguntas frecuentes y documentación detallada, visite la páginaUltralytics Documentation.