Salta para o conte√ļdo

Conjunto de dados Tiger-Pose

Introdução

Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil concebida para tarefas de estimativa de pose. Este conjunto de dados inclui 263 imagens provenientes de um vídeo do YouTube, com 210 imagens atribuídas para treino e 53 para validação. Serve como um excelente recurso para testar e resolver problemas do algoritmo de estimativa de pose.

Apesar do seu tamanho manej√°vel de 210 imagens, o conjunto de dados tiger-pose oferece diversidade, o que o torna adequado para avaliar pipelines de treino, identificar potenciais erros e servir como um valioso passo preliminar antes de trabalhar com conjuntos de dados maiores para estimativa de pose.

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLOv8.



Observa: Treina o modelo YOLOv8 Pose no conjunto de dados Tiger-Pose utilizando o Ultralytics HUB

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) serve como meio para especificar os detalhes de configura√ß√£o de um conjunto de dados. Inclui dados cruciais, como caminhos de arquivo, defini√ß√Ķes de classe e outras informa√ß√Ķes pertinentes. Especificamente, para o ficheiro tiger-pose.yaml podes verificar Ultralytics Ficheiro de configura√ß√£o do conjunto de dados Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO ūüöÄ, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ‚Ēú‚ĒÄ‚ĒÄ ultralytics
# ‚ĒĒ‚ĒÄ‚ĒÄ datasets
#     ‚ĒĒ‚ĒÄ‚ĒÄ tiger-pose  ‚Üź downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilização

Para treinar um modelo YOLOv8n-pose no conjunto de dados Tiger-Pose para 100 épocas com um tamanho de imagem de 640, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Exemplos de imagens e anota√ß√Ķes

Aqui est√£o alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com as anota√ß√Ķes correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. O mosaico √© uma t√©cnica utilizada durante o treino que combina v√°rias imagens numa √ļnica imagem para aumentar a variedade de objectos e cenas em cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objectos, propor√ß√Ķes e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios da utilização de mosaicos durante o processo de formação.

Exemplo de inferência

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Cita√ß√Ķes e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .

FAQ

Para que é utilizado o conjunto de dados Ultralytics Tiger-Pose?

O conjunto de dados Ultralytics Tiger-Pose foi concebido para tarefas de estimativa de pose, consistindo em 263 imagens provenientes de um v√≠deo do YouTube. O conjunto de dados est√° dividido em 210 imagens de treino e 53 imagens de valida√ß√£o. √Č particularmente √ļtil para testar, treinar e refinar algoritmos de estimativa de pose utilizando Ultralytics HUB e YOLOv8.

Como é que treino um modelo YOLOv8 no conjunto de dados Tiger-Pose?

Para treinar um modelo YOLOv8n-pose no conjunto de dados Tiger-Pose para 100 épocas com um tamanho de imagem de 640, usa os seguintes trechos de código. Para obter mais detalhes, visita a página Treinamento:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Que configura√ß√Ķes tem o tiger-pose.yaml inclui o ficheiro?

O tiger-pose.yaml √© utilizado para especificar os detalhes de configura√ß√£o do conjunto de dados Tiger-Pose. Inclui dados cruciais, como caminhos de ficheiros e defini√ß√Ķes de classes. Para veres a configura√ß√£o exacta, podes consultar o ficheiro Ultralytics Ficheiro de configura√ß√£o do conjunto de dados Tiger-Pose.

Como é que posso executar a inferência utilizando um modelo YOLOv8 treinado no conjunto de dados Tiger-Pose?

Para efetuar a inferência utilizando um modelo YOLOv8 treinado no conjunto de dados Tiger-Pose, podes utilizar os seguintes snippets de código. Para obter um guia detalhado, visita a página Previsão:

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Quais s√£o as vantagens de utilizar o conjunto de dados Tiger-Pose para a estimativa da pose?

O conjunto de dados Tiger-Pose, apesar do seu tamanho manejável de 210 imagens para treino, fornece uma coleção diversificada de imagens que são ideais para testar pipelines de estimativa de pose. O conjunto de dados ajuda a identificar potenciais erros e actua como um passo preliminar antes de trabalhar com conjuntos de dados maiores. Além disso, o conjunto de dados apoia a formação e o aperfeiçoamento de algoritmos de estimativa de pose utilizando ferramentas avançadas como Ultralytics HUB e YOLOv8melhorando o desempenho e a precisão do modelo.



Criado em 2023-11-12, Atualizado em 2024-07-04
Autores: glenn-jocher (9), RizwanMunawar (1)

Coment√°rios