Saltar para o conteúdo

Conjunto de dados de pose de cão

Introdução

O conjunto de dados Ultralytics O conjunto de dados Dog-pose é um conjunto de dados extenso e de alta qualidade, especificamente selecionado para a estimativa de pontos-chave de cães. Com 6.773 imagens de treino e 1.703 imagens de teste, este conjunto de dados fornece uma base sólida para o treino de modelos robustos de estimativa de pose. Cada imagem anotada inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), tornando-o um recurso valioso para investigação e desenvolvimento avançados em visão computacional.

Ultralytics Imagem de visualização da pose de cão

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLO11.

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) é utilizado para definir a configuração do conjunto de dados. Ele inclui caminhos, detalhes de pontos-chave e outras informações relevantes. No caso do conjunto de dados Dog-pose, o ficheiro dog-pose.yaml está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilização

Para treinar um modelo YOLO11n-pose no conjunto de dados Dog-pose para 100 épocas com um tamanho de imagem de 640, pode utilizar os seguintes fragmentos de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Dog-pose, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens de conjuntos de dados em mosaico. O mosaico é uma técnica utilizada durante a formação que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de formação. Isto ajuda a melhorar a capacidade de generalização do modelo para diferentes tamanhos de objectos, proporções e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Dog-pose e os benefícios da utilização de mosaicos durante o processo de formação.

Citações e agradecimentos

Se utilizar o conjunto de dados Dog-pose no seu trabalho de investigação ou desenvolvimento, cite o seguinte documento:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Gostaríamos de agradecer à equipa de Stanford pela criação e manutenção deste valioso recurso para a comunidade de visão computacional. Para mais informações sobre o conjunto de dados Dog-pose e os seus criadores, visite o sítio Web do conjunto de dados Stanford Dogs.

FAQ

O que é o conjunto de dados Dog-pose e como é utilizado com Ultralytics YOLO11 ?

O conjunto de dados Dog-Pose inclui 6.773 imagens de treino e 1.703 imagens de teste anotadas com 24 pontos-chave para a estimativa da pose de um cão. Foi concebido para treinar e validar modelos com Ultralytics YOLO11apoiando aplicações como a análise do comportamento animal, a monitorização de animais de estimação e estudos veterinários. As anotações abrangentes do conjunto de dados tornam-no ideal para desenvolver modelos precisos de estimativa de pose para caninos.

Como é que treino um modelo YOLO11 utilizando o conjunto de dados Dog-pose em Ultralytics?

Para treinar um modelo YOLO11n-pose no conjunto de dados Dog-pose para 100 épocas com um tamanho de imagem de 640, siga estes exemplos:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Para obter uma lista exaustiva dos argumentos de formação, consulte a página de formação de modelos.

Quais são as vantagens de utilizar o conjunto de dados Dog-pose?

O conjunto de dados Dog-pose oferece várias vantagens:

Conjunto de dados grande e diversificado: Com mais de 8.400 imagens, fornece dados substanciais que abrangem uma vasta gama de poses, raças e contextos de cães, permitindo uma formação e avaliação robustas do modelo.

Anotações detalhadas de pontos-chave: Cada imagem inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), oferecendo anotações precisas para treinar modelos de deteção de pose precisos.

Cenários do mundo real: Inclui imagens de ambientes variados, aumentando a capacidade de generalização do modelo para aplicações do mundo real, como monitorização de animais de estimação e análise de comportamento.

Vantagem da aprendizagem por transferência: O conjunto de dados funciona bem com técnicas de aprendizagem por transferência, permitindo que os modelos pré-treinados em conjuntos de dados de pose humana se adaptem às caraterísticas específicas dos cães.

Para mais informações sobre as suas caraterísticas e utilização, consulte a secção Introdução ao conjunto de dados.

Como é que o mosaico beneficia o processo de formação YOLO11 utilizando o conjunto de dados Dog-pose?

O mosaico, como ilustrado nas imagens de amostra do conjunto de dados Dog-pose, funde várias imagens num único composto, enriquecendo a diversidade de objectos e cenas em cada lote de treino. Esta técnica oferece várias vantagens:

  • Aumenta a variedade de poses, tamanhos e fundos de cães em cada lote
  • Melhora a capacidade do modelo para detetar cães em diferentes contextos e escalas
  • Melhora a generalização ao expor o modelo a padrões visuais mais diversos
  • Reduz o sobreajuste através da criação de novas combinações de exemplos de treino

Esta abordagem conduz a modelos mais robustos que têm um melhor desempenho em cenários do mundo real. Para ver imagens de exemplo, consulte a secção Imagens de exemplo e anotações.

Onde posso encontrar o ficheiro YAML do conjunto de dados Dog-pose e como o utilizo?

O ficheiro YAML do conjunto de dados Dog-pose pode ser encontrado em ultralytics Este ficheiro define a configuração do conjunto de dados, incluindo caminhos, classes, detalhes dos pontos-chave e outras informações relevantes. O YAML especifica 24 pontos-chave com 3 dimensões por ponto-chave, tornando-o adequado para tarefas detalhadas de estimativa de pose.

Para utilizar este ficheiro com os scripts de treino YOLO11 , basta referenciá-lo no seu comando de treino, conforme indicado na secção Utilização. O conjunto de dados será descarregado automaticamente quando for utilizado pela primeira vez, tornando a configuração simples.

Para obter mais perguntas frequentes e documentação detalhada, visite a documentaçãoUltralytics .

📅C riado há 4 meses ✏️ Atualizado há 8 dias

Comentários