Conjunto de dados Tiger-Pose

Introdução

A Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados compreende 263 imagens provenientes de um vídeo do YouTube, com 210 imagens alocadas para treino e 53 para validação. Serve como um excelente recurso para testar e solucionar problemas de algoritmos de estimativa de pose.

Apesar da sua divisão de treino gerível de 210 imagens, o conjunto de dados Tiger-Pose oferece diversidade, tornando-o adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um passo preliminar valioso antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

Este conjunto de dados destina-se ao uso com a Plataforma Ultralytics e YOLO26.

Estrutura do Dataset

  • Total de imagens: 263 (210 treino / 53 val).
  • Keypoints: 12 por tigre (sem sinalizador de visibilidade).
  • Layout do diretório: Keypoints em formato YOLO armazenados em labels/{train,val} juntamente com os diretórios images/{train,val}.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

YAML do Dataset

Um ficheiro YAML (Yet Another Markup Language) serve como o meio para especificar os detalhes de configuração de um conjunto de dados. Abrange dados cruciais como caminhos de ficheiros, definições de classes e outras informações pertinentes. Especificamente, para o ficheiro tiger-pose.yaml, podes consultar o Ficheiro de Configuração do Conjunto de Dados Tiger-Pose da Ultralytics.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilização

Para treinar um modelo YOLO26n-pose no conjunto de dados Tiger-Pose durante 100 épocas com um tamanho de imagem de 640, podes usar os seguintes fragmentos de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treino do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Amostra de Imagens e Anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as suas respetivas anotações:

Tiger pose estimation dataset mosaic training batch
  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A técnica de mosaico é um método utilizado durante o treino que combina várias imagens numa única para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.

O exemplo demonstra a variedade e a complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios de usar mosaicing durante o processo de treino.

Exemplo de Inferência

Exemplo de Inferência
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Citações e Agradecimentos

O conjunto de dados foi lançado sob a Licença AGPL-3.0.

FAQ

Para que é utilizado o conjunto de dados Tiger-Pose da Ultralytics?

O conjunto de dados Tiger-Pose da Ultralytics foi concebido para tarefas de estimativa de pose, consistindo em 263 imagens provenientes de um vídeo do YouTube. O conjunto de dados está dividido em 210 imagens de treino e 53 imagens de validação. É particularmente útil para testar, treinar e refinar algoritmos de estimativa de pose usando a Plataforma Ultralytics e o YOLO26.

Como treino um modelo YOLO26 no conjunto de dados Tiger-Pose?

Para treinar um modelo YOLO26n-pose no conjunto de dados Tiger-Pose durante 100 épocas com um tamanho de imagem de 640, usa os seguintes fragmentos de código. Para mais detalhes, visita a página de Treino:

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Que configurações inclui o ficheiro tiger-pose.yaml?

O ficheiro tiger-pose.yaml é usado para especificar os detalhes de configuração do conjunto de dados Tiger-Pose. Inclui dados cruciais como caminhos de ficheiros e definições de classes. Para ver a configuração exata, podes consultar o Ficheiro de Configuração do Conjunto de Dados Tiger-Pose da Ultralytics.

Como posso executar inferência usando um modelo YOLO26 treinado no conjunto de dados Tiger-Pose?

Para realizar inferência usando um modelo YOLO26 treinado no conjunto de dados Tiger-Pose, podes usar os seguintes fragmentos de código. Para um guia detalhado, visita a página de Predição:

Exemplo de Inferência
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Quais são os benefícios de usar o conjunto de dados Tiger-Pose para estimativa de pose?

O conjunto de dados Tiger-Pose, apesar da sua dimensão gerível de 210 imagens para treino, fornece uma coleção diversa de imagens que são ideais para testar pipelines de estimativa de pose. O conjunto de dados ajuda a identificar potenciais erros e atua como um passo preliminar antes de trabalhar com conjuntos de dados maiores. Adicionalmente, o conjunto de dados suporta o treino e o refinamento de algoritmos de estimativa de pose usando ferramentas avançadas como a Plataforma Ultralytics e o YOLO26, melhorando o desempenho e a precisão do modelo.

Comentários