Jeu de données Dog-Pose

Introduction

Le jeu de données Dog-Pose d'Ultralytics est un jeu de données étendu et de haute qualité, spécifiquement conçu pour l'estimation des points clés canins. Avec 6 773 images d'entraînement et 1 703 images de test, ce jeu de données constitue une base solide pour entraîner des modèles robustes d'estimation de pose.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Chaque image annotée comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), ce qui en fait une ressource précieuse pour la recherche et le développement avancés en vision par ordinateur.

Ultralytics Dog-pose display image

Ce jeu de données est destiné à être utilisé avec Ultralytics Platform et YOLO26.

Structure du jeu de données

  • Répartition : 6 773 images d'entraînement / 1 703 images de test avec des fichiers d'étiquettes au format YOLO correspondants.

  • Keypoints: 24 per dog with (x, y, visibility) triplets.

  • Mise en page :

    datasets/dog-pose/
    ├── images/{train,test}
    └── labels/{train,test}

YAML du jeu de données

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il inclut les chemins, les détails des points clés et d'autres informations pertinentes. Dans le cas du jeu de données Dog-pose, le fichier dog-pose.yaml est disponible sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilisation

Pour entraîner un modèle YOLO26n-pose sur le jeu de données Dog-pose pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Exemples d'images et d'annotations

Voici quelques exemples d'images issues du jeu de données Dog-pose, accompagnées de leurs annotations correspondantes :

Dog pose estimation dataset mosaic training batch
  • Image en mosaïque : Cette image démontre un lot d'entraînement composé d'images du jeu de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes au sein de chaque lot d'entraînement. Cela aide à améliorer la capacité du modèle à généraliser à différentes tailles d'objets, ratios d'aspect et contextes.

L'exemple illustre la variété et la complexité des images du jeu de données Dog-pose ainsi que les avantages de l'utilisation du mosaïquage lors du processus d'entraînement.

Citations et remerciements

Si tu utilises le jeu de données Dog-pose dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Nous tenons à remercier l'équipe de Stanford pour avoir créé et maintenu cette ressource précieuse pour la communauté de la vision par ordinateur. Pour plus d'informations sur le jeu de données Dog-pose et ses créateurs, visite le site web du Stanford Dogs Dataset.

FAQ

Qu'est-ce que le jeu de données Dog-pose et comment est-il utilisé avec Ultralytics YOLO26 ?

Le jeu de données Dog-Pose contient 6 773 images d'entraînement et 1 703 images de test annotées avec 24 points clés pour l'estimation de la pose canine. Il est conçu pour l'entraînement et la validation de modèles avec Ultralytics YOLO26, prenant en charge des applications telles que l'analyse du comportement animal, la surveillance des animaux de compagnie et les études vétérinaires. Les annotations complètes du jeu de données le rendent idéal pour développer des modèles précis d'estimation de pose pour les chiens.

Comment entraîner un modèle YOLO26 en utilisant le jeu de données Dog-pose dans Ultralytics ?

Pour entraîner un modèle YOLO26n-pose sur le jeu de données Dog-pose pendant 100 époques avec une taille d'image de 640, suis ces exemples :

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Pour une liste complète des arguments d'entraînement, reporte-toi à la page Entraînement du modèle.

Quels sont les avantages de l'utilisation du jeu de données Dog-pose ?

Le jeu de données Dog-pose offre plusieurs avantages :

Jeu de données vaste et diversifié : Avec plus de 8 400 images, il fournit des données substantielles couvrant un large éventail de poses, de races et de contextes canins, permettant un entraînement et une évaluation robustes du modèle.

Annotations détaillées des points clés : Chaque image inclut 24 points clés avec 3 dimensions par point clé (x, y, visibilité), offrant des annotations précises pour entraîner des modèles de détection de pose exacts.

Scénarios du monde réel : Inclut des images issues d'environnements variés, renforçant la capacité du modèle à se généraliser à des applications réelles comme la surveillance d'animaux et l'analyse comportementale.

Avantage de l'apprentissage par transfert : Le jeu de données fonctionne bien avec les techniques d'apprentissage par transfert, permettant aux modèles pré-entraînés sur des jeux de données de pose humaine de s'adapter aux caractéristiques spécifiques aux chiens.

Pour en savoir plus sur ses fonctionnalités et son utilisation, consulte la section Introduction au jeu de données.

Comment le mosaïquage profite-t-il au processus d'entraînement de YOLO26 en utilisant le jeu de données Dog-pose ?

Le mosaïquage, tel qu'illustré dans les exemples d'images du jeu de données Dog-pose, fusionne plusieurs images en une seule composition, enrichissant la diversité des objets et des scènes dans chaque lot d'entraînement. Cette technique offre plusieurs avantages :

  • Augmente la variété des poses, des tailles et des arrière-plans des chiens dans chaque lot
  • Améliore la capacité du modèle à détecter les chiens dans différents contextes et échelles
  • Renforce la généralisation en exposant le modèle à des motifs visuels plus diversifiés
  • Réduit le surapprentissage en créant de nouvelles combinaisons d'exemples d'entraînement

Cette approche conduit à des modèles plus robustes qui fonctionnent mieux dans des scénarios réels. Pour des exemples d'images, consulte la section Exemples d'images et annotations.

Où puis-je trouver le fichier YAML du jeu de données Dog-pose et comment l'utiliser ?

Le fichier YAML du jeu de données Dog-pose peut être trouvé sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Ce fichier définit la configuration du jeu de données, incluant les chemins, les classes, les détails des points clés et d'autres informations pertinentes. Le YAML spécifie 24 points clés avec 3 dimensions par point clé, ce qui le rend adapté aux tâches détaillées d'estimation de pose.

Pour utiliser ce fichier avec les scripts d'entraînement YOLO26, référence-le simplement dans ta commande d'entraînement comme indiqué dans la section Utilisation. Le jeu de données sera automatiquement téléchargé lors de la première utilisation, rendant la configuration simple.

Pour plus de FAQ et une documentation détaillée, visite la Documentation Ultralytics.

Commentaires