Salta para o conteĆŗdo

Conjunto de dados Tiger-Pose

IntroduĆ§Ć£o

Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleĆ§Ć£o versĆ”til concebida para tarefas de estimativa de pose. Este conjunto de dados inclui 263 imagens provenientes de um vĆ­deo do YouTube, com 210 imagens atribuĆ­das para treino e 53 para validaĆ§Ć£o. Serve como um excelente recurso para testar e resolver problemas do algoritmo de estimativa de pose.

Apesar do seu tamanho manejƔvel de 210 imagens, o conjunto de dados tiger-pose oferece diversidade, o que o torna adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um valioso passo preliminar antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLOv8.



Observa: Treina o modelo YOLOv8 Pose no conjunto de dados Tiger-Pose utilizando Ultralytics HUB

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) serve como meio para especificar os detalhes de configuraĆ§Ć£o de um conjunto de dados. Inclui dados cruciais, como caminhos de arquivo, definiƧƵes de classe e outras informaƧƵes pertinentes. Especificamente, para o ficheiro tiger-pose.yaml podes verificar Ultralytics Ficheiro de configuraĆ§Ć£o do conjunto de dados Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO šŸš€, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ā”œā”€ā”€ ultralytics
# ā””ā”€ā”€ datasets
#     ā””ā”€ā”€ tiger-pose  ā† downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

UtilizaĆ§Ć£o

Para treinar um modelo YOLOv8n-pose no conjunto de dados Tiger-Pose para 100 Ć©pocas com um tamanho de imagem de 640, podes utilizar os seguintes snippets de cĆ³digo. Para obter uma lista abrangente dos argumentos disponĆ­veis, consulta a pĆ”gina Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Exemplos de imagens e anotaƧƵes

Aqui estĆ£o alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as anotaƧƵes correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. O mosaico Ć© uma tĆ©cnica utilizada durante o treino que combina vĆ”rias imagens numa Ćŗnica imagem para aumentar a variedade de objectos e cenas em cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objectos, proporƧƵes e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Tiger-Pose e os benefĆ­cios da utilizaĆ§Ć£o de mosaicos durante o processo de formaĆ§Ć£o.

Exemplo de inferĆŖncia

Exemplo de inferĆŖncia

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

CitaƧƵes e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licenƧaAGPL-3.0 .



Criado em 2023-11-12, Atualizado em 2024-02-03
Autores: glenn-jocher (5), RizwanMunawar (1)

ComentƔrios