Salta para o conteúdo

Conjunto de dados Tiger-Pose

Introdução

Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados inclui 263 imagens provenientes de um vídeo do YouTube, com 210 imagens atribuídas para treino e 53 para validação. Serve como um excelente recurso para testar e resolver problemas do algoritmo de estimativa de pose.

Apesar do seu tamanho manejável de 210 imagens, o conjunto de dados tiger-pose oferece diversidade, o que o torna adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um valioso passo preliminar antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

This dataset is intended for use with Ultralytics HUB and YOLO11.



Observa: Train YOLO11 Pose Model on Tiger-Pose Dataset Using Ultralytics HUB

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) serve como meio para especificar os detalhes de configuração de um conjunto de dados. Inclui dados cruciais, como caminhos de arquivo, definições de classe e outras informações pertinentes. Especificamente, para o ficheiro tiger-pose.yaml podes verificar Ultralytics Ficheiro de configuração do conjunto de dados Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilização

To train a YOLO11n-pose model on the Tiger-Pose dataset for 100 epochs with an image size of 640, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. O mosaico é uma técnica utilizada durante o treino que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objectos, proporções e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios da utilização de mosaicos durante o processo de formação.

Exemplo de inferência

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citações e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .

FAQ

Para que é utilizado o conjunto de dados Ultralytics Tiger-Pose?

The Ultralytics Tiger-Pose dataset is designed for pose estimation tasks, consisting of 263 images sourced from a YouTube video. The dataset is divided into 210 training images and 53 validation images. It is particularly useful for testing, training, and refining pose estimation algorithms using Ultralytics HUB and YOLO11.

How do I train a YOLO11 model on the Tiger-Pose dataset?

To train a YOLO11n-pose model on the Tiger-Pose dataset for 100 epochs with an image size of 640, use the following code snippets. For more details, visit the Training page:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Que configurações tem o tiger-pose.yaml inclui o ficheiro?

O tiger-pose.yaml é utilizado para especificar os detalhes de configuração do conjunto de dados Tiger-Pose. Inclui dados cruciais, como caminhos de ficheiros e definições de classes. Para veres a configuração exacta, podes consultar o ficheiro Ultralytics Ficheiro de configuração do conjunto de dados Tiger-Pose.

How can I run inference using a YOLO11 model trained on the Tiger-Pose dataset?

To perform inference using a YOLO11 model trained on the Tiger-Pose dataset, you can use the following code snippets. For a detailed guide, visit the Prediction page:

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Quais são as vantagens de utilizar o conjunto de dados Tiger-Pose para a estimativa da pose?

The Tiger-Pose dataset, despite its manageable size of 210 images for training, provides a diverse collection of images that are ideal for testing pose estimation pipelines. The dataset helps identify potential errors and acts as a preliminary step before working with larger datasets. Additionally, the dataset supports the training and refinement of pose estimation algorithms using advanced tools like Ultralytics HUB and YOLO11, enhancing model performance and accuracy.

📅 Created 11 months ago ✏️ Updated 22 days ago

Comentários