Conjunto de dados Tiger-Pose
Introdução
A Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados compreende 263 imagens provenientes de um vídeo do YouTube, com 210 imagens alocadas para treino e 53 para validação. Serve como um excelente recurso para testar e solucionar problemas de algoritmos de estimativa de pose.
Apesar da sua divisão de treino gerível de 210 imagens, o conjunto de dados Tiger-Pose oferece diversidade, tornando-o adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um passo preliminar valioso antes de trabalhar com conjuntos de dados maiores para estimativa de pose.
Este conjunto de dados destina-se ao uso com a Plataforma Ultralytics e YOLO26.
Estrutura do Dataset
- Total de imagens: 263 (210 treino / 53 val).
- Keypoints: 12 por tigre (sem sinalizador de visibilidade).
- Layout do diretório: Keypoints em formato YOLO armazenados em
labels/{train,val}juntamente com os diretóriosimages/{train,val}.
Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform
YAML do Dataset
Um ficheiro YAML (Yet Another Markup Language) serve como o meio para especificar os detalhes de configuração de um conjunto de dados. Abrange dados cruciais como caminhos de ficheiros, definições de classes e outras informações pertinentes. Especificamente, para o ficheiro tiger-pose.yaml, podes consultar o Ficheiro de Configuração do Conjunto de Dados Tiger-Pose da Ultralytics.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Keypoint names per class
kpt_names:
0:
- nose
- head
- withers
- tail_base
- right_hind_hock
- right_hind_paw
- left_hind_paw
- left_hind_hock
- right_front_wrist
- right_front_paw
- left_front_wrist
- left_front_paw
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zipUtilização
Para treinar um modelo YOLO26n-pose no conjunto de dados Tiger-Pose durante 100 épocas com um tamanho de imagem de 640, podes usar os seguintes fragmentos de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treino do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Amostra de Imagens e Anotações
Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as suas respetivas anotações:
- Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A técnica de mosaico é um método utilizado durante o treino que combina várias imagens numa única para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.
O exemplo demonstra a variedade e a complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios de usar mosaicing durante o processo de treino.
Exemplo de Inferência
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Citações e Agradecimentos
O conjunto de dados foi lançado sob a Licença AGPL-3.0.
FAQ
Para que é utilizado o conjunto de dados Tiger-Pose da Ultralytics?
O conjunto de dados Tiger-Pose da Ultralytics foi concebido para tarefas de estimativa de pose, consistindo em 263 imagens provenientes de um vídeo do YouTube. O conjunto de dados está dividido em 210 imagens de treino e 53 imagens de validação. É particularmente útil para testar, treinar e refinar algoritmos de estimativa de pose usando a Plataforma Ultralytics e o YOLO26.
Como treino um modelo YOLO26 no conjunto de dados Tiger-Pose?
Para treinar um modelo YOLO26n-pose no conjunto de dados Tiger-Pose durante 100 épocas com um tamanho de imagem de 640, usa os seguintes fragmentos de código. Para mais detalhes, visita a página de Treino:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Que configurações inclui o ficheiro tiger-pose.yaml?
O ficheiro tiger-pose.yaml é usado para especificar os detalhes de configuração do conjunto de dados Tiger-Pose. Inclui dados cruciais como caminhos de ficheiros e definições de classes. Para ver a configuração exata, podes consultar o Ficheiro de Configuração do Conjunto de Dados Tiger-Pose da Ultralytics.
Como posso executar inferência usando um modelo YOLO26 treinado no conjunto de dados Tiger-Pose?
Para realizar inferência usando um modelo YOLO26 treinado no conjunto de dados Tiger-Pose, podes usar os seguintes fragmentos de código. Para um guia detalhado, visita a página de Predição:
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Quais são os benefícios de usar o conjunto de dados Tiger-Pose para estimativa de pose?
O conjunto de dados Tiger-Pose, apesar da sua dimensão gerível de 210 imagens para treino, fornece uma coleção diversa de imagens que são ideais para testar pipelines de estimativa de pose. O conjunto de dados ajuda a identificar potenciais erros e atua como um passo preliminar antes de trabalhar com conjuntos de dados maiores. Adicionalmente, o conjunto de dados suporta o treino e o refinamento de algoritmos de estimativa de pose usando ferramentas avançadas como a Plataforma Ultralytics e o YOLO26, melhorando o desempenho e a precisão do modelo.