Conjunto de datos Dog-Pose
Introducción
La base de datos Ultralytics Dog-pose dataset es un amplio conjunto de datos de alta calidad creado específicamente para la estimación de puntos clave de perros. Con 6.773 imágenes de entrenamiento y 1.703 imágenes de prueba, este conjunto de datos proporciona una base sólida para el entrenamiento de modelos robustos de estimación de poses. Cada imagen anotada incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que la convierte en un valioso recurso para la investigación y el desarrollo avanzados en visión por ordenador.
Este conjunto de datos está pensado para su uso con Ultralytics HUB y YOLO11.
Conjunto de datos YAML
Para definir la configuración del conjunto de datos se utiliza un archivo YAML (Yet Another Markup Language). Incluye rutas, detalles de los puntos clave y otra información relevante. En el caso del conjunto de datos Dog-pose, el archivo dog-pose.yaml
está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilización
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.
Ejemplo de tren
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Ejemplos de imágenes y anotaciones
He aquí algunos ejemplos de imágenes del conjunto de datos Dog-pose, junto con sus correspondientes anotaciones:
- Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos Dog-pose y las ventajas de utilizar mosaicos durante el proceso de entrenamiento.
Citas y agradecimientos
Si utiliza el conjunto de datos Dog-pose en su trabajo de investigación o desarrollo, cite el siguiente documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Queremos agradecer al equipo de Stanford la creación y el mantenimiento de este valioso recurso para la comunidad de visión por ordenador. Para más información sobre el conjunto de datos Dog-pose y sus creadores, visite el sitio web Stanford Dogs Dataset.
PREGUNTAS FRECUENTES
¿Qué es el conjunto de datos Dog-pose y cómo se utiliza con Ultralytics YOLO11 ?
El conjunto de datos Dog-Pose incluye 6.773 imágenes de entrenamiento y 1.703 imágenes de prueba anotadas con 24 puntos clave para la estimación de la pose de los perros. Está diseñado para entrenar y validar modelos con Ultralytics YOLO11para aplicaciones como el análisis del comportamiento animal, la supervisión de mascotas y los estudios veterinarios. Las completas anotaciones del conjunto de datos lo hacen ideal para desarrollar modelos precisos de estimación de la pose para caninos.
¿Cómo entreno un modelo YOLO11 utilizando el conjunto de datos Dog-pose en Ultralytics?
Para entrenar un modelo YOLO11n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, siga estos ejemplos:
Ejemplo de tren
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Para obtener una lista completa de los argumentos de formación, consulte la página de formación del modelo.
¿Cuáles son las ventajas de utilizar el conjunto de datos Dog-pose?
El conjunto de datos Dog-pose ofrece varias ventajas:
Conjunto de datos amplio y diverso: Con más de 8.400 imágenes, proporciona datos sustanciales que abarcan una amplia gama de poses, razas y contextos caninos, lo que permite un sólido entrenamiento y evaluación de modelos.
Anotaciones detalladas de puntos clave: Cada imagen incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), ofreciendo anotaciones precisas para el entrenamiento de modelos precisos de detección de pose.
Escenarios del mundo real: Incluye imágenes de entornos variados, lo que mejora la capacidad del modelo para generalizarse a aplicaciones del mundo real como la vigilancia de mascotas y el análisis del comportamiento.
Ventaja del aprendizaje por transferencia: El conjunto de datos funciona bien con las técnicas de aprendizaje por transferencia, lo que permite que los modelos preentrenados en conjuntos de datos de poses humanas se adapten a las características específicas de los perros.
Para más información sobre sus características y uso, consulte la sección Introducción al conjunto de datos.
¿En qué beneficia el mosaico al proceso de formación YOLO11 utilizando el conjunto de datos Dog-pose?
El mosaico, como se ilustra en las imágenes de muestra del conjunto de datos Dog-pose, fusiona varias imágenes en una sola compuesta, enriqueciendo la diversidad de objetos y escenas en cada lote de entrenamiento. Esta técnica ofrece varias ventajas:
- Aumenta la variedad de poses, tamaños y fondos de los perros en cada lote
- Mejora la capacidad del modelo para detectar perros en diferentes contextos y escalas
- Mejora la generalización al exponer el modelo a patrones visuales más diversos.
- Reduce el sobreajuste creando nuevas combinaciones de ejemplos de entrenamiento
Este enfoque da lugar a modelos más robustos que funcionan mejor en escenarios del mundo real. Para ver imágenes de ejemplo, consulte la sección Imágenes de muestra y anotaciones.
¿Dónde puedo encontrar el archivo YAML del conjunto de datos Dog-pose y cómo puedo utilizarlo?
El archivo YAML del conjunto de datos Dog-pose se encuentra en ultralytics Este archivo define la configuración del conjunto de datos, incluyendo rutas, clases, detalles de los puntos clave y otra información relevante. El YAML especifica 24 puntos clave con 3 dimensiones por punto clave, lo que lo hace adecuado para tareas detalladas de estimación de la pose.
Para utilizar este archivo con los scripts de entrenamiento YOLO11 , simplemente haga referencia a él en su comando de entrenamiento como se muestra en la sección Uso. El conjunto de datos se descargará automáticamente cuando se utilice por primera vez, lo que facilita la configuración.
Para más preguntas frecuentes y documentación detallada, visite la páginaUltralytics Documentation.