Link to this sectionConjunto de datos Dog-Pose#

Link to this sectionIntroducción#

El conjunto de datos Dog-Pose de Ultralytics es un conjunto de datos extenso y de alta calidad, diseñado específicamente para la estimación de puntos clave en perros, que proporciona 6.773 imágenes de entrenamiento y 1.703 de validación.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Cada imagen anotada incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que lo convierte en un recurso valioso para la investigación y el desarrollo avanzados en visión artificial.

Para una raza específica o un animal diferente, Ultralytics Platform gestiona la carga, el etiquetado y el entrenamiento de un modelo de puntos clave personalizado con tus propios datos sin necesidad de gestionar la infraestructura.

Link to this sectionEstructura del dataset#

Imágenes totales: 8.476 (6.773 de entrenamiento / 1.703 de validación) con archivos de etiquetas en formato YOLO correspondientes.
Puntos clave: 24 por perro con tripletes (x, y, visibility).
Tamaño de descarga: ~337 MB.

Diseño:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionYAML del dataset#

Se utiliza un archivo YAML para definir la configuración del conjunto de datos. Incluye rutas, detalles de puntos clave y otra información relevante. En el caso del conjunto de datos Dog-Pose, el archivo dog-pose.yaml está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionUso#

Para entrenar un modelo YOLO26n-pose en el conjunto de datos Dog-Pose durante 100 epochs con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Training del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionMuestras de imágenes y anotaciones#

Aquí tienes algunos ejemplos de imágenes del conjunto de datos Dog-Pose, junto con sus anotaciones correspondientes:

Dog pose estimation dataset mosaic training batch

Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Dog-Pose y los beneficios de usar mosaicing durante el proceso de entrenamiento.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos Dog-Pose en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Queremos agradecer al equipo de Stanford por crear y mantener este valioso recurso para la comunidad de computer vision. Para obtener más información sobre el conjunto de datos Dog-Pose y sus creadores, visita el sitio web de Stanford Dogs Dataset.

Link to this sectionFAQ#

Link to this section¿Qué es el conjunto de datos Dog-Pose y cómo se utiliza con Ultralytics YOLO26?#

El conjunto de datos Dog-Pose incluye 6.773 imágenes de entrenamiento y 1.703 de validación, anotadas con 24 puntos clave para la estimación de la postura del perro. Está diseñado para entrenar y validar modelos con Ultralytics YOLO26, admitiendo aplicaciones como el análisis del comportamiento animal, la supervisión de mascotas y estudios veterinarios. Las exhaustivas anotaciones del conjunto de datos lo hacen ideal para desarrollar modelos precisos de estimación de postura para caninos.

Link to this section¿Cómo entreno un modelo YOLO26 usando el conjunto de datos Dog-Pose en Ultralytics?#

Carga yolo26n-pose.pt y ejecuta model.train(data="dog-pose.yaml", epochs=100, imgsz=640) — consulta el Train Example anterior para ver los fragmentos completos de Python y CLI, y la página de Training del modelo para ver una lista completa de argumentos.

Link to this section¿Cuáles son los beneficios de utilizar el conjunto de datos Dog-Pose?#

Con 8.476 imágenes en total (6.773 de entrenamiento / 1.703 de validación) que cubren una amplia gama de razas y posturas de perros, y 24 puntos clave en 3 dimensiones (x, y, visibilidad) por anotación, el conjunto de datos Dog-Pose ofrece a los modelos la cobertura de escenarios del mundo real necesaria para aplicaciones como la supervisión de mascotas y el análisis del comportamiento. Para obtener más información sobre sus características y uso, consulta la sección Dataset Introduction.

Link to this section¿Cómo beneficia el mosaicing al proceso de entrenamiento de YOLO26 utilizando el conjunto de datos Dog-Pose?#

El mosaicing combina varias imágenes de Dog-Pose en una sola imagen de entrenamiento, lo que aumenta la variedad de posturas, tamaños y fondos de perro que el modelo ve en cada paso; esto mejora la generalización a nuevos contextos y escalas, a la vez que reduce el sobreajuste. Para ver imágenes de ejemplo, consulta la sección Sample Images and Annotations.

Link to this section¿Dónde puedo encontrar el archivo YAML del conjunto de datos Dog-Pose y cómo lo utilizo?#

El archivo YAML del conjunto de datos Dog-Pose se puede encontrar en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Este archivo define la configuración del conjunto de datos, incluyendo rutas, clases, detalles de los puntos clave y otra información relevante. El YAML especifica 24 puntos clave con 3 dimensiones por cada punto clave, lo que lo hace adecuado para tareas detalladas de estimación de postura.

Para utilizar este archivo con scripts de entrenamiento de YOLO26, simplemente haz referencia a él en tu comando de entrenamiento como se muestra en la sección de Uso. El conjunto de datos se descargará automáticamente la primera vez que se utilice, lo que hace que la configuración sea sencilla.

Para obtener más información sobre los modelos de puntos clave, consulta los documentos de la tarea de Estimación de pose.

Colaboradores

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

Creado 16 nov 2024Actualizado hace 3 días