Conjunto de datos Tiger-Pose

Introducción

Ultralytics presenta el conjunto de datos Tiger-Pose, una colección versátil diseñada para tareas de estimación de pose. Este conjunto de datos consta de 263 imágenes obtenidas de un video de YouTube, con 210 imágenes asignadas para entrenamiento y 53 para validación. Sirve como un recurso excelente para probar y depurar algoritmos de estimación de pose.

A pesar de su manejable división de entrenamiento de 210 imágenes, el conjunto de datos Tiger-Pose ofrece diversidad, lo que lo hace adecuado para evaluar canalizaciones de entrenamiento, identificar errores potenciales y servir como un paso preliminar valioso antes de trabajar con conjuntos de datos más grandes para estimación de pose.

Este conjunto de datos está diseñado para su uso con Ultralytics Platform y YOLO26.

Estructura del conjunto de datos

  • Total de imágenes: 263 (210 de entrenamiento / 53 de validación).
  • Puntos clave: 12 por tigre (sin indicador de visibilidad).
  • Diseño del directorio: puntos clave en formato YOLO almacenados en labels/{train,val} junto a los directorios images/{train,val}.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

YAML del conjunto de datos

Un archivo YAML (Yet Another Markup Language) sirve como medio para especificar los detalles de configuración de un conjunto de datos. Abarca datos cruciales como rutas de archivos, definiciones de clases y otra información pertinente. Específicamente, para el archivo tiger-pose.yaml, puedes consultar el Archivo de configuración del conjunto de datos Tiger-Pose de Ultralytics.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Uso

Para entrenar un modelo YOLO26n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Imágenes y anotaciones de muestra

Aquí tienes algunos ejemplos de imágenes del conjunto de datos Tiger-Pose, junto con sus anotaciones correspondientes:

Tiger pose estimation dataset mosaic training batch
  • Imagen en mosaico: esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Tiger-Pose y los beneficios de usar mosaico durante el proceso de entrenamiento.

Ejemplo de inferencia

Ejemplo de inferencia
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Citas y reconocimientos

El conjunto de datos ha sido publicado bajo la AGPL-3.0 License.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos Tiger-Pose de Ultralytics?

El conjunto de datos Tiger-Pose de Ultralytics está diseñado para tareas de estimación de pose y consta de 263 imágenes obtenidas de un video de YouTube. El conjunto de datos está dividido en 210 imágenes de entrenamiento y 53 de validación. Es particularmente útil para probar, entrenar y refinar algoritmos de estimación de pose utilizando Ultralytics Platform y YOLO26.

¿Cómo entreno un modelo YOLO26 en el conjunto de datos Tiger-Pose?

Para entrenar un modelo YOLO26n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, usa los siguientes fragmentos de código. Para más detalles, visita la página de Entrenamiento:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

¿Qué configuraciones incluye el archivo tiger-pose.yaml?

El archivo tiger-pose.yaml se utiliza para especificar los detalles de configuración del conjunto de datos Tiger-Pose. Incluye datos cruciales como rutas de archivos y definiciones de clases. Para ver la configuración exacta, puedes consultar el Archivo de configuración del conjunto de datos Tiger-Pose de Ultralytics.

¿Cómo puedo ejecutar la inferencia utilizando un modelo YOLO26 entrenado en el conjunto de datos Tiger-Pose?

Para realizar la inferencia utilizando un modelo YOLO26 entrenado en el conjunto de datos Tiger-Pose, puedes usar los siguientes fragmentos de código. Para obtener una guía detallada, visita la página de Predicción:

Ejemplo de inferencia
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

¿Cuáles son los beneficios de usar el conjunto de datos Tiger-Pose para la estimación de pose?

El conjunto de datos Tiger-Pose, a pesar de su tamaño manejable de 210 imágenes para el entrenamiento, proporciona una colección diversa de imágenes que son ideales para probar canalizaciones de estimación de pose. El conjunto de datos ayuda a identificar errores potenciales y actúa como un paso preliminar antes de trabajar con conjuntos de datos más grandes. Además, el conjunto de datos admite el entrenamiento y refinamiento de algoritmos de estimación de pose utilizando herramientas avanzadas como Ultralytics Platform y YOLO26, mejorando el rendimiento y la precisión del modelo.

Comentarios