Meet YOLO26: next-gen vision AI.

Link to this sectionConjunto de datos Dog-Pose#

Link to this sectionIntroducción#

El conjunto de datos Dog-Pose de Ultralytics es un conjunto de datos extenso y de alta calidad creado específicamente para la estimación de puntos clave en perros. Con 6.773 imágenes de entrenamiento y 1.703 imágenes de prueba, este conjunto de datos proporciona una base sólida para entrenar modelos robustos de estimación de pose.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Cada imagen anotada incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que lo convierte en un recurso valioso para la investigación y el desarrollo avanzados en visión artificial.

Ultralytics Dog-pose display image

Este conjunto de datos está pensado para usarse con Ultralytics Platform y YOLO26.

Link to this sectionEstructura del dataset#

  • División: 6.773 imágenes de entrenamiento / 1.703 de validación con archivos de etiquetas en formato YOLO coincidentes.

  • Keypoints: 24 per dog with (x, y, visibility) triplets.

  • Diseño:

    datasets/dog-pose/
    ├── images/{train,val}
    └── labels/{train,val}

Link to this sectionYAML del dataset#

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Incluye rutas, detalles de puntos clave y otra información relevante. En el caso del conjunto de datos Dog-pose, el archivo dog-pose.yaml está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionUso#

Para entrenar un modelo YOLO26n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionMuestras de imágenes y anotaciones#

Aquí tienes algunos ejemplos de imágenes del conjunto de datos Dog-pose, junto con sus anotaciones correspondientes:

Dog pose estimation dataset mosaic training batch
  • Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Dog-pose y los beneficios de utilizar mosaicos durante el proceso de entrenamiento.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos Dog-pose en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Nos gustaría agradecer al equipo de Stanford por crear y mantener este valioso recurso para la comunidad de visión artificial. Para obtener más información sobre el conjunto de datos Dog-pose y sus creadores, visita el sitio web del conjunto de datos Stanford Dogs.

Link to this sectionFAQ#

Link to this section¿Qué es el conjunto de datos Dog-pose y cómo se utiliza con Ultralytics YOLO26?#

El conjunto de datos Dog-Pose cuenta con 6.773 imágenes de entrenamiento y 1.703 de prueba anotadas con 24 puntos clave para la estimación de la pose del perro. Está diseñado para entrenar y validar modelos con Ultralytics YOLO26, dando soporte a aplicaciones como el análisis de comportamiento animal, el seguimiento de mascotas y estudios veterinarios. Las exhaustivas anotaciones del conjunto de datos lo hacen ideal para desarrollar modelos precisos de estimación de pose para caninos.

Link to this section¿Cómo entreno un modelo YOLO26 utilizando el conjunto de datos Dog-pose en Ultralytics?#

Para entrenar un modelo YOLO26n-pose en el conjunto de datos Dog-pose durante 100 épocas con un tamaño de imagen de 640, sigue estos ejemplos:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Para obtener una lista completa de los argumentos de entrenamiento, consulta la página de Entrenamiento del modelo.

Link to this section¿Cuáles son los beneficios de utilizar el conjunto de datos Dog-pose?#

El conjunto de datos Dog-pose ofrece varios beneficios:

Conjunto de datos grande y diverso: Con más de 8.400 imágenes, proporciona datos sustanciales que cubren una amplia gama de poses de perros, razas y contextos, lo que permite un entrenamiento y una evaluación robustos del modelo.

Anotaciones detalladas de puntos clave: Cada imagen incluye 24 puntos clave con 3 dimensiones por punto clave (x, y, visibilidad), lo que ofrece anotaciones precisas para entrenar modelos exactos de detección de pose.

Escenarios del mundo real: Incluye imágenes de entornos variados, lo que mejora la capacidad del modelo para generalizar a aplicaciones del mundo real como el seguimiento de mascotas y el análisis de comportamiento.

Ventaja del aprendizaje por transferencia: El conjunto de datos funciona bien con técnicas de aprendizaje por transferencia, permitiendo que los modelos preentrenados en conjuntos de datos de pose humana se adapten a características específicas de los perros.

Para obtener más información sobre sus características y uso, consulta la sección de Introducción al conjunto de datos.

Link to this section¿Cómo beneficia la técnica de mosaico al proceso de entrenamiento de YOLO26 utilizando el conjunto de datos Dog-pose?#

El mosaico, tal como se ilustra en las imágenes de muestra del conjunto de datos Dog-pose, fusiona varias imágenes en un solo compuesto, enriqueciendo la diversidad de objetos y escenas en cada lote de entrenamiento. Esta técnica ofrece varios beneficios:

  • Aumenta la variedad de poses, tamaños y fondos de los perros en cada lote
  • Mejora la capacidad del modelo para detectar perros en diferentes contextos y escalas
  • Mejora la generalización al exponer al modelo a patrones visuales más diversos
  • Reduce el sobreajuste al crear combinaciones novedosas de ejemplos de entrenamiento

Este enfoque conduce a modelos más robustos que funcionan mejor en escenarios del mundo real. Para ver imágenes de ejemplo, consulta la sección de Imágenes de muestra y anotaciones.

Link to this section¿Dónde puedo encontrar el archivo YAML del conjunto de datos Dog-pose y cómo lo utilizo?#

El archivo YAML del conjunto de datos Dog-pose se puede encontrar en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Este archivo define la configuración del conjunto de datos, incluyendo rutas, clases, detalles de puntos clave y otra información relevante. El YAML especifica 24 puntos clave con 3 dimensiones por punto clave, lo que lo hace adecuado para tareas detalladas de estimación de pose.

Para utilizar este archivo con scripts de entrenamiento de YOLO26, simplemente haz referencia a él en tu comando de entrenamiento como se muestra en la sección de Uso. El conjunto de datos se descargará automáticamente la primera vez que se utilice, lo que hace que la configuración sea sencilla.

Para más preguntas frecuentes y documentación detallada, visita la Documentación de Ultralytics.

Comentarios