Saltar para o conteúdo

Conjunto de dados Tiger-Pose

Introdução

Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados inclui 263 imagens provenientes de um vídeo do YouTube, com 210 imagens afectadas para treino e 53 para validação. Constitui um excelente recurso para testar e resolver problemas do algoritmo de estimativa de pose.

Apesar do seu tamanho manejável de 210 imagens, o conjunto de dados tiger-pose oferece diversidade, o que o torna adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um valioso passo preliminar antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLO11.



Ver: Treinar o modelo YOLO11 Pose no conjunto de dados Tiger-Pose utilizando o Ultralytics HUB

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) serve como meio para especificar os detalhes de configuração de um conjunto de dados. Inclui dados cruciais, como caminhos de ficheiros, definições de classes e outras informações pertinentes. Especificamente, para o ficheiro tiger-pose.yaml é possível verificar Ultralytics Ficheiro de configuração do conjunto de dados Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilização

Para treinar um modelo YOLO11n-pose no conjunto de dados Tiger-Pose para 100 épocas com um tamanho de imagem de 640, pode utilizar os seguintes fragmentos de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens de conjuntos de dados em mosaico. O mosaico é uma técnica utilizada durante a formação que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de formação. Isto ajuda a melhorar a capacidade de generalização do modelo para diferentes tamanhos de objectos, proporções e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios da utilização de mosaicos durante o processo de formação.

Exemplo de inferência

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citações e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .

FAQ

Para que é utilizado o conjunto de dados Ultralytics Tiger-Pose?

O conjunto de dados Ultralytics Tiger-Pose foi concebido para tarefas de estimativa de pose, consistindo em 263 imagens provenientes de um vídeo do YouTube. O conjunto de dados está dividido em 210 imagens de treino e 53 imagens de validação. É particularmente útil para testar, treinar e aperfeiçoar algoritmos de estimativa de pose utilizando Ultralytics HUB e YOLO11.

Como é que treino um modelo YOLO11 no conjunto de dados Tiger-Pose?

Para treinar um modelo YOLO11n-pose no conjunto de dados Tiger-Pose para 100 épocas com um tamanho de imagem de 640, use os seguintes trechos de código. Para obter mais detalhes, visite a página Treinamento:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Que configurações é que o tiger-pose.yaml incluir ficheiro?

O tiger-pose.yaml é utilizado para especificar os detalhes de configuração do conjunto de dados Tiger-Pose. Inclui dados cruciais, tais como caminhos de ficheiros e definições de classes. Para ver a configuração exacta, pode consultar o ficheiro Ultralytics Ficheiro de configuração do conjunto de dados Tiger-Pose.

Como é que posso executar a inferência utilizando um modelo YOLO11 treinado no conjunto de dados Tiger-Pose?

Para efetuar a inferência utilizando um modelo YOLO11 treinado no conjunto de dados Tiger-Pose, pode utilizar os seguintes snippets de código. Para obter um guia detalhado, visite a página Previsão:

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Quais são as vantagens de utilizar o conjunto de dados Tiger-Pose para a estimativa da pose?

O conjunto de dados Tiger-Pose, apesar do seu tamanho manejável de 210 imagens para treino, fornece uma coleção diversificada de imagens que são ideais para testar pipelines de estimativa de pose. O conjunto de dados ajuda a identificar potenciais erros e actua como um passo preliminar antes de trabalhar com conjuntos de dados maiores. Além disso, o conjunto de dados apoia a formação e o aperfeiçoamento de algoritmos de estimativa de pose utilizando ferramentas avançadas como Ultralytics HUB e YOLO11melhorando o desempenho e a precisão do modelo.

📅C riado há 1 ano ✏️ Atualizado há 3 meses

Comentários