Conjunto de datos de postura de perro
Introducción
El Ultralytics Dog-pose es un extenso conjunto de datos de alta calidad creado específicamente para la estimación del punto clave de los perros. Con 6.773 imágenes de entrenamiento y 1.703 imágenes de prueba, este conjunto de datos proporciona una base sólida para entrenar modelos robustos de estimación de la pose. Cada imagen anotada incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que lo convierte en un valioso recurso para la investigación y el desarrollo avanzados en visión por ordenador.
Este conjunto de datos está pensado para ser utilizado con Ultralytics HUB y YOLO11.
Conjunto de datos YAML
Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Incluye rutas, detalles de los puntos clave y otra información relevante. En el caso del conjunto de datos Dog-pose, el archivo dog-pose.yaml
está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilización
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.
Ejemplo de tren
Ejemplos de imágenes y anotaciones
He aquí algunos ejemplos de imágenes del conjunto de datos Dog-pose, junto con sus correspondientes anotaciones:
- Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizarse a diferentes tamaños de objetos, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos Dog-pose y las ventajas de utilizar mosaicos durante el proceso de entrenamiento.
Citas y agradecimientos
Si utilizas el conjunto de datos Dog-pose en tu trabajo de investigación o desarrollo, cita el siguiente documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Queremos agradecer al equipo de Stanford la creación y el mantenimiento de este valioso recurso para la comunidad de visión por ordenador. Para más información sobre el conjunto de datos Dog-pose y sus creadores, visita el sitio web Stanford Dogs Dataset.
PREGUNTAS FRECUENTES
¿Qué es el conjunto de datos Dog-pose y cómo se utiliza con Ultralytics YOLO11?
El conjunto de datos Dog-Pose contiene 6.000 imágenes anotadas con 17 puntos clave para la estimación de la pose de los perros. Ideal para entrenar y validar modelos con Ultralytics YOLO11, sirve de apoyo a aplicaciones como el análisis del comportamiento animal y los estudios veterinarios.
¿Cómo entreno un modelo YOLO11 utilizando el conjunto de datos Dog-pose en Ultralytics?
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, sigue estos ejemplos:
Ejemplo de tren
Para obtener una lista completa de argumentos de entrenamiento, consulta la página de entrenamiento del modelo.
¿Cuáles son las ventajas de utilizar el conjunto de datos Dog-pose?
El conjunto de datos Dog-pose ofrece varias ventajas:
Conjunto de datos amplio y diverso: Con 6.000 imágenes, proporciona una cantidad sustancial de datos que abarcan una amplia gama de poses, razas y contextos caninos, lo que permite un entrenamiento y una evaluación sólidos del modelo.
Anotaciones específicas de pose: Ofrece anotaciones detalladas para la estimación de la pose, garantizando datos de alta calidad para el entrenamiento de los modelos de detección de pose.
Escenarios del mundo real: Incluye imágenes de entornos variados, mejorando la capacidad del modelo para generalizarse a aplicaciones del mundo real.
Mejora del rendimiento del modelo: La diversidad y la escala del conjunto de datos ayudan a mejorar la precisión y la solidez del modelo, sobre todo en las tareas que implican una estimación de pose de grano fino.
Para más información sobre sus características y uso, consulta la sección Introducción al Conjunto de Datos.
¿Cómo beneficia el mosaico al proceso de entrenamiento de YOLO11 utilizando el conjunto de datos Dog-pose?
El mosaico, como se ilustra en las imágenes de muestra del conjunto de datos Dog-pose, fusiona varias imágenes en un único compuesto, enriqueciendo la diversidad de objetos y escenas de cada lote de entrenamiento. Este enfoque mejora la capacidad del modelo para generalizar a través de diferentes tamaños de objetos, relaciones de aspecto y contextos, lo que conduce a un mejor rendimiento. Para ver imágenes de ejemplo, consulta la sección Imágenes de muestra y anotaciones.
¿Dónde puedo encontrar el archivo YAML del conjunto de datos Dog-pose y cómo lo utilizo?
El archivo YAML del conjunto de datos Dog-pose se encuentra aquí. Este archivo define la configuración del conjunto de datos, incluyendo rutas, clases y otra información relevante. Utiliza este archivo con los scripts de entrenamiento de YOLO11, como se menciona en la sección Ejemplo de entrenamiento.
Para más preguntas frecuentes y documentación detallada, visita la Documentación deUltralytics .