Link to this sectionConjunto de Dados Dog-Pose#

Link to this sectionIntrodução#

O conjunto de dados Dog-Pose da Ultralytics é um conjunto de dados extenso e de alta qualidade especificamente curado para estimativa de pontos-chave (keypoints) em cães, fornecendo 6.773 imagens de treinamento e 1.703 de validação.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Cada imagem anotada inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), tornando-o um recurso valioso para pesquisa e desenvolvimento avançado em visão computacional.

Para uma raça específica ou um animal diferente, a Plataforma Ultralytics gerencia o upload, rotulagem e treinamento de um modelo de pontos-chave personalizado em seus próprios dados sem a necessidade de gerenciar infraestrutura.

Link to this sectionEstrutura do Dataset#

Total de imagens: 8.476 (6.773 treino / 1.703 val) com arquivos de rótulo correspondentes no formato YOLO.
Keypoints: 24 por cão com trios (x, y, visibility).
Tamanho do download: ~337 MB.

Layout:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionYAML do Dataset#

Um arquivo YAML é usado para definir a configuração do conjunto de dados. Ele inclui caminhos, detalhes dos pontos-chave e outras informações relevantes. No caso do conjunto de dados Dog-Pose, o arquivo dog-pose.yaml está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionUso#

Para treinar um modelo YOLO26n-pose no conjunto de dados Dog-Pose por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes snippets de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionExemplos de Imagens e Anotações#

Aqui estão alguns exemplos de imagens do conjunto de dados Dog-Pose, juntamente com suas anotações correspondentes:

Dog pose estimation dataset mosaic training batch

Imagem em Mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A mosaicação é uma técnica usada durante o treino que combina múltiplas imagens numa única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objeto, proporções e contextos.

O exemplo demonstra a variedade e a complexidade das imagens no conjunto de dados Dog-Pose e os benefícios de usar mosaico durante o processo de treinamento.

Link to this sectionCitações e Agradecimentos#

Se você usar o conjunto de dados Dog-Pose em sua pesquisa ou trabalho de desenvolvimento, por favor, cite o seguinte artigo:

Citação

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Gostaríamos de agradecer à equipe de Stanford por criar e manter este recurso valioso para a comunidade de visão computacional. Para mais informações sobre o conjunto de dados Dog-Pose e seus criadores, visite o site do Stanford Dogs Dataset.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados Dog-Pose e como ele é usado com o YOLO26 da Ultralytics?#

O conjunto de dados Dog-Pose apresenta 6.773 imagens de treinamento e 1.703 de validação anotadas com 24 pontos-chave para estimativa de pose de cães. Ele foi projetado para treinar e validar modelos com o Ultralytics YOLO26, suportando aplicações como análise de comportamento animal, monitoramento de animais de estimação e estudos veterinários. As anotações abrangentes do conjunto de dados o tornam ideal para desenvolver modelos precisos de estimativa de pose para caninos.

Link to this sectionComo treino um modelo YOLO26 usando o conjunto de dados Dog-Pose na Ultralytics?#

Carregue yolo26n-pose.pt e chame model.train(data="dog-pose.yaml", epochs=100, imgsz=640) — veja o Exemplo de Treinamento acima para os snippets completos em Python e CLI, e a página de Treinamento do modelo para uma lista abrangente de argumentos.

Link to this sectionQuais são os benefícios de usar o conjunto de dados Dog-Pose?#

Com 8.476 imagens no total (6.773 treino / 1.703 val) cobrindo uma ampla gama de raças e poses de cães, e 24 pontos-chave em 3 dimensões (x, y, visibilidade) por anotação, o conjunto de dados Dog-Pose oferece aos modelos a cobertura de cenários do mundo real necessária para aplicações como monitoramento de animais de estimação e análise de comportamento. Para mais informações sobre seus recursos e uso, consulte a seção Introdução ao Conjunto de Dados.

Link to this sectionComo o mosaico beneficia o processo de treinamento do YOLO26 usando o conjunto de dados Dog-Pose?#

O mosaico combina várias imagens do Dog-Pose em uma única imagem de treinamento, aumentando a variedade de poses, tamanhos e planos de fundo de cães que o modelo vê a cada passo, o que melhora a generalização para novos contextos e escalas enquanto reduz o sobreajuste (overfitting). Para exemplos de imagens, consulte a seção Imagens de Exemplo e Anotações.

Link to this sectionOnde posso encontrar o arquivo YAML do conjunto de dados Dog-Pose e como o utilizo?#

O arquivo YAML do conjunto de dados Dog-Pose pode ser encontrado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes, detalhes dos pontos-chave e outras informações relevantes. O YAML especifica 24 pontos-chave com 3 dimensões por ponto-chave, tornando-o adequado para tarefas detalhadas de estimativa de pose.

Para usar este arquivo com scripts de treinamento do YOLO26, basta referenciá-lo em seu comando de treinamento conforme mostrado na seção Uso. O conjunto de dados será baixado automaticamente quando usado pela primeira vez, tornando a configuração simples.

Para mais informações sobre modelos de pontos-chave, vê os documentos da tarefa Pose Estimation.

Contribuidores

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

Criado 16 de nov. de 2024Atualizado anteontem