Saltar al contenido

Conjunto de datos Tiger-Pose

Introducción

Ultralytics presenta el conjunto de datos Tiger-Pose, una colección versátil diseñada para tareas de estimación de la pose. Este conjunto de datos consta de 263 imágenes procedentes de un vídeo de YouTube, con 210 imágenes asignadas para el entrenamiento y 53 para la validación. Sirve como excelente recurso para probar y solucionar problemas del algoritmo de estimación de la pose.

A pesar de su manejable tamaño de 210 imágenes, el conjunto de datos de la pose del tigre ofrece diversidad, lo que lo hace adecuado para evaluar las canalizaciones de entrenamiento, identificar posibles errores y servir como un valioso paso preliminar antes de trabajar con conjuntos de datos más grandes para la estimación de la pose.

Este conjunto de datos está pensado para su uso con Ultralytics HUB y YOLOv8.



Observa: Entrena el modelo YOLOv8 Pose en el conjunto de datos Tiger-Pose utilizando Ultralytics HUB

Conjunto de datos YAML

Un archivo YAML (Yet Another Markup Language) sirve para especificar los detalles de configuración de un conjunto de datos. Abarca datos cruciales como rutas de archivos, definiciones de clases y otra información pertinente. En concreto, para el tiger-pose.yaml puedes comprobar Ultralytics Archivo de configuración del conjunto de datos Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilización

Para entrenar un modelo YOLOv8n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n-pose.pt epochs=100 imgsz=640

Ejemplos de imágenes y anotaciones

He aquí algunos ejemplos de imágenes del conjunto de datos Tiger-Pose, junto con sus correspondientes anotaciones:

Imagen de muestra del conjunto de datos

  • Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizarse a diferentes tamaños de objetos, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos Tiger-Pose y las ventajas de utilizar mosaicos durante el proceso de entrenamiento.

Ejemplo de inferencia

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citas y agradecimientos

El conjunto de datos se ha publicado bajo la LicenciaAGPL-3.0 .

PREGUNTAS FRECUENTES

¿Para qué se utiliza el conjunto de datos Ultralytics Tiger-Pose?

El conjunto de datos Ultralytics Tiger-Pose está diseñado para tareas de estimación de la pose, y consta de 263 imágenes procedentes de un vídeo de YouTube. El conjunto de datos se divide en 210 imágenes de entrenamiento y 53 imágenes de validación. Es especialmente útil para probar, entrenar y refinar algoritmos de estimación de la pose utilizando Ultralytics HUB y YOLOv8.

¿Cómo entreno un modelo YOLOv8 en el conjunto de datos Tiger-Pose?

Para entrenar un modelo YOLOv8n-pose en el conjunto de datos Tiger-Pose durante 100 épocas con un tamaño de imagen de 640, utiliza los siguientes fragmentos de código. Para más detalles, visita la página Entrenamiento:

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

¿Qué configuraciones tiene el tiger-pose.yaml ¿incluir archivo?

En tiger-pose.yaml se utiliza para especificar los detalles de configuración del conjunto de datos Tiger-Pose. Incluye datos cruciales como las rutas de los archivos y las definiciones de las clases. Para ver la configuración exacta, puedes consultar el archivo Ultralytics Archivo de configuración del conjunto de datos Tiger-Pose.

¿Cómo puedo ejecutar la inferencia utilizando un modelo YOLOv8 entrenado en el conjunto de datos Tiger-Pose?

Para realizar inferencias utilizando un modelo YOLOv8 entrenado en el conjunto de datos Tiger-Pose, puedes utilizar los siguientes fragmentos de código. Para obtener una guía detallada, visita la página Predicción:

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

¿Qué ventajas tiene utilizar el conjunto de datos Tiger-Pose para la estimación de la pose?

El conjunto de datos Tiger-Pose, a pesar de su manejable tamaño de 210 imágenes para el entrenamiento, proporciona una colección diversa de imágenes ideales para probar las canalizaciones de estimación de la pose. El conjunto de datos ayuda a identificar posibles errores y actúa como paso preliminar antes de trabajar con conjuntos de datos más grandes. Además, el conjunto de datos permite entrenar y perfeccionar los algoritmos de estimación de la pose utilizando herramientas avanzadas como Ultralytics HUB y YOLOv8mejorando el rendimiento y la precisión del modelo.



Creado 2023-11-12, Actualizado 2024-07-17
Autores: hnliu_2@stu.xidian.edu.cn (1), glenn-jocher (9), RizwanMunawar (1)

Comentarios