Link to this sectionConjunto de Dados Dog-Pose#
Link to this sectionIntrodução#
O conjunto de dados Dog-Pose da Ultralytics é um conjunto de dados extenso e de alta qualidade especificamente selecionado para a estimativa de pontos-chave em cães. Com 6.773 imagens de treinamento e 1.703 imagens de teste, este conjunto de dados fornece uma base sólida para treinar modelos robustos de estimativa de pose.
Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial
Cada imagem anotada inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), tornando-o um recurso valioso para pesquisa e desenvolvimento avançado em visão computacional.
Este conjunto de dados destina-se a ser utilizado com a Ultralytics Platform e YOLO26.
Link to this sectionEstrutura do Dataset#
-
Divisão: 6.773 imagens de treino / 1.703 de val com arquivos de rótulo correspondentes no formato YOLO.
-
Keypoints: 24 per dog with
(x, y, visibility)triplets. -
Layout:
datasets/dog-pose/ ├── images/{train,val} └── labels/{train,val}
Link to this sectionYAML do Dataset#
Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele inclui caminhos, detalhes dos pontos-chave e outras informações relevantes. No caso do conjunto de dados Dog-pose, o dog-pose.yaml está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zipLink to this sectionUso#
Para treinar um modelo YOLO26n-pose no conjunto de dados Dog-pose por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Link to this sectionExemplos de Imagens e Anotações#
Aqui estão alguns exemplos de imagens do conjunto de dados Dog-pose, juntamente com suas respectivas anotações:
- Imagem em Mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A mosaicação é uma técnica usada durante o treino que combina múltiplas imagens numa única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objeto, proporções e contextos.
O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados Dog-pose e os benefícios do uso de mosaico durante o processo de treinamento.
Link to this sectionCitações e Agradecimentos#
Se você usar o conjunto de dados Dog-pose em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}Gostaríamos de agradecer à equipe de Stanford por criar e manter este recurso valioso para a comunidade de visão computacional. Para mais informações sobre o conjunto de dados Dog-pose e seus criadores, visite o site do Stanford Dogs Dataset.
Link to this sectionFAQ#
Link to this sectionO que é o conjunto de dados Dog-pose e como ele é usado com o Ultralytics YOLO26?#
O conjunto de dados Dog-Pose apresenta 6.773 imagens de treinamento e 1.703 de teste anotadas com 24 pontos-chave para estimativa de pose canina. Ele foi projetado para treinar e validar modelos com o Ultralytics YOLO26, oferecendo suporte a aplicações como análise de comportamento animal, monitoramento de pets e estudos veterinários. As anotações abrangentes do conjunto de dados o tornam ideal para desenvolver modelos precisos de estimativa de pose para cães.
Link to this sectionComo treino um modelo YOLO26 usando o conjunto de dados Dog-pose no Ultralytics?#
Para treinar um modelo YOLO26n-pose no conjunto de dados Dog-pose por 100 épocas com um tamanho de imagem de 640, siga estes exemplos:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Para uma lista abrangente de argumentos de treinamento, consulte a página de Treinamento do modelo.
Link to this sectionQuais são os benefícios de usar o conjunto de dados Dog-pose?#
O conjunto de dados Dog-pose oferece vários benefícios:
Conjunto de Dados Grande e Diverso: Com mais de 8.400 imagens, ele fornece dados substanciais cobrindo uma ampla gama de poses, raças e contextos de cães, permitindo um treinamento e avaliação robustos do modelo.
Anotações Detalhadas de Pontos-chave: Cada imagem inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), oferecendo anotações precisas para treinar modelos de detecção de pose precisos.
Cenários do Mundo Real: Inclui imagens de ambientes variados, aumentando a capacidade do modelo de generalizar para aplicações do mundo real como monitoramento de pets e análise de comportamento.
Vantagem de Transfer Learning: O conjunto de dados funciona bem com técnicas de transfer learning, permitindo que modelos pré-treinados em conjuntos de dados de pose humana se adaptem a características específicas de cães.
Para mais informações sobre seus recursos e uso, consulte a seção Introdução ao Conjunto de Dados.
Link to this sectionComo o mosaico beneficia o processo de treinamento do YOLO26 usando o conjunto de dados Dog-pose?#
O mosaico, como ilustrado nas imagens de exemplo do conjunto de dados Dog-pose, funde várias imagens em um único composto, enriquecendo a diversidade de objetos e cenas em cada lote de treinamento. Esta técnica oferece vários benefícios:
- Aumenta a variedade de poses, tamanhos e planos de fundo de cães em cada lote
- Melhora a capacidade do modelo de detectar cães em diferentes contextos e escalas
- Melhora a generalização ao expor o modelo a padrões visuais mais diversos
- Reduz o sobreajuste (overfitting) ao criar novas combinações de exemplos de treinamento
Esta abordagem leva a modelos mais robustos que apresentam melhor desempenho em cenários do mundo real. Para exemplos de imagens, consulte a seção Imagens de Exemplo e Anotações.
Link to this sectionOnde posso encontrar o arquivo YAML do conjunto de dados Dog-pose e como o utilizo?#
O arquivo YAML do conjunto de dados Dog-pose pode ser encontrado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes, detalhes dos pontos-chave e outras informações relevantes. O YAML especifica 24 pontos-chave com 3 dimensões por ponto-chave, tornando-o adequado para tarefas detalhadas de estimativa de pose.
Para usar este arquivo com scripts de treinamento do YOLO26, basta referenciá-lo em seu comando de treinamento conforme mostrado na seção Uso. O conjunto de dados será baixado automaticamente quando usado pela primeira vez, tornando a configuração simples.
Para mais perguntas frequentes e documentação detalhada, visite a Documentação do Ultralytics.