Salta para o conteúdo

Conjunto de dados Tiger-Pose

Introdução

Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados inclui 263 imagens provenientes de um vídeo do YouTube, com 210 imagens atribuídas para treino e 53 para validação. Serve como um excelente recurso para testar e resolver problemas do algoritmo de estimativa de pose.

Apesar do seu tamanho manejável de 210 imagens, o conjunto de dados tiger-pose oferece diversidade, o que o torna adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um valioso passo preliminar antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLOv8.



Observa: Treina o modelo YOLOv8 Pose no conjunto de dados Tiger-Pose utilizando o Ultralytics HUB

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) serve como meio para especificar os detalhes de configuração de um conjunto de dados. Inclui dados cruciais, como caminhos de arquivo, definições de classe e outras informações pertinentes. Especificamente, para o ficheiro tiger-pose.yaml podes verificar Ultralytics Ficheiro de configuração do conjunto de dados Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Utilização

Para treinar um modelo YOLOv8n-pose no conjunto de dados Tiger-Pose para 100 épocas com um tamanho de imagem de 640, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. O mosaico é uma técnica utilizada durante o treino que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objectos, proporções e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios da utilização de mosaicos durante o processo de formação.

Exemplo de inferência

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

Citações e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .



Criado em 2023-11-12, Atualizado em 2024-02-03
Autores: glenn-jocher (5), RizwanMunawar (1)

Comentários