Conjunto de dados de pose de cão
Introdução
O conjunto de dados Ultralytics O conjunto de dados Dog-pose é um conjunto de dados extenso e de alta qualidade, especificamente selecionado para a estimativa de pontos-chave de cães. Com 6.773 imagens de treino e 1.703 imagens de teste, este conjunto de dados fornece uma base sólida para treinar modelos robustos de estimativa de pose. Cada imagem anotada inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), tornando-o um recurso valioso para investigação e desenvolvimento avançados em visão computacional.
Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLO11.
Conjunto de dados YAML
Um ficheiro YAML (Yet Another Markup Language) é utilizado para definir a configuração do conjunto de dados. Inclui caminhos, detalhes de pontos-chave e outras informações relevantes. No caso do conjunto de dados Dog-pose, o ficheiro dog-pose.yaml
está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Utilização
Para treinar um modelo YOLO11n-pose no conjunto de dados Dog-pose para 100 épocas com um tamanho de imagem de 640, podes utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulta a página Treino do modelo.
Exemplo de comboio
Exemplos de imagens e anotações
Aqui estão alguns exemplos de imagens do conjunto de dados Dog-pose, juntamente com as anotações correspondentes:
- Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. O mosaico é uma técnica utilizada durante o treino que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objectos, proporções e contextos.
O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Dog-pose e os benefícios da utilização de mosaicos durante o processo de formação.
Citações e agradecimentos
Se utilizares o conjunto de dados Dog-pose no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Gostaríamos de agradecer à equipa de Stanford por criar e manter este valioso recurso para a comunidade de visão computacional. Para mais informações sobre o conjunto de dados Dog-pose e os seus criadores, visita o sítio Web Stanford Dogs Dataset.
FAQ
O que é o conjunto de dados Dog-pose e como é utilizado com Ultralytics YOLO11?
O conjunto de dados Dog-Pose apresenta 6.000 imagens anotadas com 17 pontos-chave para a estimativa da pose do cão. Ideal para treinar e validar modelos com Ultralytics YOLO11, suporta aplicações como a análise do comportamento animal e estudos veterinários.
Como é que treino um modelo YOLO11 utilizando o conjunto de dados Dog-pose em Ultralytics?
Para treinar um modelo YOLO11n-pose no conjunto de dados Dog-pose para 100 épocas com um tamanho de imagem de 640, segue estes exemplos:
Exemplo de comboio
Para obteres uma lista completa de argumentos de formação, consulta a página de formação de modelos.
Quais são as vantagens de utilizar o conjunto de dados Dog-pose?
O conjunto de dados Dog-pose oferece várias vantagens:
Conjunto de dados grande e diversificado: Com 6.000 imagens, fornece uma quantidade substancial de dados que cobrem uma vasta gama de poses, raças e contextos de cães, permitindo uma formação e avaliação robustas do modelo.
Anotações específicas da pose: Oferece anotações detalhadas para a estimativa de pose, garantindo dados de alta qualidade para treinar modelos de deteção de pose.
Cenários do mundo real: Inclui imagens de ambientes variados, aumentando a capacidade de generalização do modelo para aplicações no mundo real.
Melhoria do desempenho do modelo: A diversidade e a escala do conjunto de dados ajudam a melhorar a exatidão e a robustez do modelo, particularmente para tarefas que envolvem uma estimativa de pose de grão fino.
Para mais informações sobre as suas características e utilização, consulta a secção Introdução ao conjunto de dados.
Como é que o mosaico beneficia o processo de formação YOLO11 utilizando o conjunto de dados Dog-pose?
O mosaico, como ilustrado nas imagens de amostra do conjunto de dados Dog-pose, funde várias imagens num único composto, enriquecendo a diversidade de objectos e cenas em cada lote de treino. Esta abordagem aumenta a capacidade do modelo para generalizar através de diferentes tamanhos de objectos, proporções e contextos, levando a um melhor desempenho. Para imagens de exemplo, consulta a secção Imagens de exemplo e anotações.
Onde posso encontrar o ficheiro YAML do conjunto de dados Dog-pose e como o utilizo?
O ficheiro YAML do conjunto de dados Dog-pose pode ser encontrado aqui. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes e outras informações relevantes. Utiliza este ficheiro com os scripts de treino YOLO11, conforme mencionado na secção Exemplo de treino.
Para obter mais perguntas frequentes e documentação detalhada, visita a documentaçãoUltralytics .