Meet YOLO26: next-gen vision AI.

Link to this sectionConjunto de Dados Dog-Pose#

Link to this sectionIntrodução#

O conjunto de dados Dog-Pose da Ultralytics é um conjunto de dados extenso e de alta qualidade especificamente selecionado para a estimativa de pontos-chave em cães. Com 6.773 imagens de treinamento e 1.703 imagens de teste, este conjunto de dados fornece uma base sólida para treinar modelos robustos de estimativa de pose.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Cada imagem anotada inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), tornando-o um recurso valioso para pesquisa e desenvolvimento avançado em visão computacional.

Ultralytics Dog-pose display image

Este conjunto de dados destina-se a ser utilizado com a Ultralytics Platform e YOLO26.

Link to this sectionEstrutura do Dataset#

  • Divisão: 6.773 imagens de treino / 1.703 de val com arquivos de rótulo correspondentes no formato YOLO.

  • Keypoints: 24 per dog with (x, y, visibility) triplets.

  • Layout:

    datasets/dog-pose/
    ├── images/{train,val}
    └── labels/{train,val}

Link to this sectionYAML do Dataset#

Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele inclui caminhos, detalhes dos pontos-chave e outras informações relevantes. No caso do conjunto de dados Dog-pose, o dog-pose.yaml está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionUso#

Para treinar um modelo YOLO26n-pose no conjunto de dados Dog-pose por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionExemplos de Imagens e Anotações#

Aqui estão alguns exemplos de imagens do conjunto de dados Dog-pose, juntamente com suas respectivas anotações:

Dog pose estimation dataset mosaic training batch
  • Imagem em Mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A mosaicação é uma técnica usada durante o treino que combina múltiplas imagens numa única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objeto, proporções e contextos.

O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados Dog-pose e os benefícios do uso de mosaico durante o processo de treinamento.

Link to this sectionCitações e Agradecimentos#

Se você usar o conjunto de dados Dog-pose em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

Citação
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Gostaríamos de agradecer à equipe de Stanford por criar e manter este recurso valioso para a comunidade de visão computacional. Para mais informações sobre o conjunto de dados Dog-pose e seus criadores, visite o site do Stanford Dogs Dataset.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados Dog-pose e como ele é usado com o Ultralytics YOLO26?#

O conjunto de dados Dog-Pose apresenta 6.773 imagens de treinamento e 1.703 de teste anotadas com 24 pontos-chave para estimativa de pose canina. Ele foi projetado para treinar e validar modelos com o Ultralytics YOLO26, oferecendo suporte a aplicações como análise de comportamento animal, monitoramento de pets e estudos veterinários. As anotações abrangentes do conjunto de dados o tornam ideal para desenvolver modelos precisos de estimativa de pose para cães.

Link to this sectionComo treino um modelo YOLO26 usando o conjunto de dados Dog-pose no Ultralytics?#

Para treinar um modelo YOLO26n-pose no conjunto de dados Dog-pose por 100 épocas com um tamanho de imagem de 640, siga estes exemplos:

Exemplo de Treinamento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Para uma lista abrangente de argumentos de treinamento, consulte a página de Treinamento do modelo.

Link to this sectionQuais são os benefícios de usar o conjunto de dados Dog-pose?#

O conjunto de dados Dog-pose oferece vários benefícios:

Conjunto de Dados Grande e Diverso: Com mais de 8.400 imagens, ele fornece dados substanciais cobrindo uma ampla gama de poses, raças e contextos de cães, permitindo um treinamento e avaliação robustos do modelo.

Anotações Detalhadas de Pontos-chave: Cada imagem inclui 24 pontos-chave com 3 dimensões por ponto-chave (x, y, visibilidade), oferecendo anotações precisas para treinar modelos de detecção de pose precisos.

Cenários do Mundo Real: Inclui imagens de ambientes variados, aumentando a capacidade do modelo de generalizar para aplicações do mundo real como monitoramento de pets e análise de comportamento.

Vantagem de Transfer Learning: O conjunto de dados funciona bem com técnicas de transfer learning, permitindo que modelos pré-treinados em conjuntos de dados de pose humana se adaptem a características específicas de cães.

Para mais informações sobre seus recursos e uso, consulte a seção Introdução ao Conjunto de Dados.

Link to this sectionComo o mosaico beneficia o processo de treinamento do YOLO26 usando o conjunto de dados Dog-pose?#

O mosaico, como ilustrado nas imagens de exemplo do conjunto de dados Dog-pose, funde várias imagens em um único composto, enriquecendo a diversidade de objetos e cenas em cada lote de treinamento. Esta técnica oferece vários benefícios:

  • Aumenta a variedade de poses, tamanhos e planos de fundo de cães em cada lote
  • Melhora a capacidade do modelo de detectar cães em diferentes contextos e escalas
  • Melhora a generalização ao expor o modelo a padrões visuais mais diversos
  • Reduz o sobreajuste (overfitting) ao criar novas combinações de exemplos de treinamento

Esta abordagem leva a modelos mais robustos que apresentam melhor desempenho em cenários do mundo real. Para exemplos de imagens, consulte a seção Imagens de Exemplo e Anotações.

Link to this sectionOnde posso encontrar o arquivo YAML do conjunto de dados Dog-pose e como o utilizo?#

O arquivo YAML do conjunto de dados Dog-pose pode ser encontrado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes, detalhes dos pontos-chave e outras informações relevantes. O YAML especifica 24 pontos-chave com 3 dimensões por ponto-chave, tornando-o adequado para tarefas detalhadas de estimativa de pose.

Para usar este arquivo com scripts de treinamento do YOLO26, basta referenciá-lo em seu comando de treinamento conforme mostrado na seção Uso. O conjunto de dados será baixado automaticamente quando usado pela primeira vez, tornando a configuração simples.

Para mais perguntas frequentes e documentação detalhada, visite a Documentação do Ultralytics.

Comentários