Ir al contenido

Conjunto de datos Tiger-Pose

Introducción

Ultralytics presenta el conjunto de datos Tiger-Pose, una colección versátil diseñada para tareas de estimación de pose. Este conjunto de datos comprende 263 imágenes procedentes de un video de YouTube, con 210 imágenes asignadas para el entrenamiento y 53 para la validación. Sirve como un excelente recurso para probar y solucionar problemas de algoritmos de estimación de pose.

A pesar de su tamaño manejable de 210 imágenes, el conjunto de datos Tiger-Pose ofrece diversidad, lo que lo hace adecuado para evaluar las canalizaciones de entrenamiento, identificar posibles errores y servir como un valioso paso preliminar antes de trabajar con conjuntos de datos más grandes para la estimación de la pose.

Este conjunto de datos está diseñado para su uso con Ultralytics HUB y YOLO11.



Ver: Entrenar el modelo de pose YOLO11 en el conjunto de datos Tiger-Pose usando Ultralytics HUB

YAML del conjunto de datos

Un archivo YAML (Yet Another Markup Language) sirve como medio para especificar los detalles de configuración de un conjunto de datos. Abarca datos cruciales como rutas de archivos, definiciones de clases y otra información pertinente. Específicamente, para el tiger-pose.yaml archivo, puede consultar Archivo de configuración del conjunto de datos Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Uso

Para entrenar un modelo YOLO11n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

sample_images y anotaciones

Aquí hay algunos ejemplos de imágenes del conjunto de datos Tiger-Pose, junto con sus anotaciones correspondientes:

Imagen de muestra del conjunto de datos

  • Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola imagen para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Tiger-Pose y los beneficios de usar mosaicos durante el proceso de entrenamiento.

Ejemplo de inferencia

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citas y agradecimientos

El conjunto de datos se ha publicado y está disponible bajo la Licencia AGPL-3.0.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos Ultralytics Tiger-Pose?

El conjunto de datos Tiger-Pose de Ultralytics está diseñado para tareas de estimación de poses y consta de 263 imágenes obtenidas de un video de YouTube. El conjunto de datos se divide en 210 imágenes de entrenamiento y 53 imágenes de validación. Es particularmente útil para probar, entrenar y refinar algoritmos de estimación de poses utilizando Ultralytics HUB y YOLO11.

¿Cómo entreno un modelo YOLO11 en el conjunto de datos Tiger-Pose?

Para entrenar un modelo YOLO11n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, utilice los siguientes fragmentos de código. Para obtener más detalles, visite la página de Entrenamiento:

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

¿Qué configuraciones incluye el tiger-pose.yaml archivo?

El tiger-pose.yaml El archivo se utiliza para especificar los detalles de configuración del conjunto de datos Tiger-Pose. Incluye datos cruciales como rutas de archivos y definiciones de clases. Para ver la configuración exacta, puede consultar el Archivo de configuración del conjunto de datos Ultralytics Tiger-Pose.

¿Cómo puedo ejecutar la inferencia utilizando un modelo YOLO11 entrenado en el conjunto de datos Tiger-Pose?

Para realizar la inferencia utilizando un modelo YOLO11 entrenado en el conjunto de datos Tiger-Pose, puede utilizar los siguientes fragmentos de código. Para obtener una guía detallada, visite la página de Predicción:

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

¿Cuáles son los beneficios de usar el conjunto de datos Tiger-Pose para la estimación de poses?

El conjunto de datos Tiger-Pose, a pesar de su tamaño manejable de 210 imágenes para el entrenamiento, proporciona una colección diversa de imágenes que son ideales para probar los pipelines de estimación de poses. El conjunto de datos ayuda a identificar posibles errores y actúa como un paso preliminar antes de trabajar con conjuntos de datos más grandes. Además, el conjunto de datos admite el entrenamiento y el perfeccionamiento de algoritmos de estimación de poses utilizando herramientas avanzadas como Ultralytics HUB y YOLO11, lo que mejora el rendimiento del modelo y la precisión.



📅 Creado hace 1 año ✏️ Actualizado hace 5 meses

Comentarios