Passer au contenu

Ensemble de données Dog-Pose

Introduction

L'ensemble de données Dog-pose d'Ultralytics est un ensemble de données étendu et de haute qualité, spécialement conçu pour l'estimation des points clés des chiens. Avec 6 773 images d'entraînement et 1 703 images de test, cet ensemble de données fournit une base solide pour l'entraînement de modèles robustes d'estimation de pose.



Regarder : Comment entraîner Ultralytics YOLO11 sur l'ensemble de données Stanford Dog Pose Estimation | Tutoriel étape par étape 🚀

Chaque image annotée comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), ce qui en fait une ressource précieuse pour la recherche et le développement avancés en vision par ordinateur.

Image d'affichage de pose de chien Ultralytics

Ce jeu de données est destiné à être utilisé avec HUB Ultralytics et YOLO11.

YAML du jeu de données

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration de l'ensemble de données. Il comprend les chemins d'accès, les détails des points clés et d'autres informations pertinentes. Dans le cas de l'ensemble de données Dog-pose, le dog-pose.yaml est disponible sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilisation

Pour entraîner un modèle YOLO11n-pose sur le jeu de données Dog-pose pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Images et annotations d'exemple

Voici quelques exemples d'images du jeu de données Dog-pose, ainsi que leurs annotations correspondantes :

Exemple d'image de l'ensemble de données

  • Image mosaïque : Cette image montre un lot d'entraînement composé d'images d'ensemble de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes dans chaque lot d'entraînement. Cela permet d'améliorer la capacité du modèle à se généraliser à différentes tailles d'objets, rapports hauteur/largeur et contextes.

Cet exemple illustre la variété et la complexité des images dans l'ensemble de données Dog-pose, ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.

Citations et remerciements

Si vous utilisez l'ensemble de données Dog-pose dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Nous tenons à remercier l'équipe de Stanford pour la création et la maintenance de cette ressource précieuse pour la communauté de la vision par ordinateur. Pour plus d'informations sur le jeu de données Dog-pose et ses créateurs, consultez le site web du Stanford Dogs Dataset.

FAQ

Qu'est-ce que l'ensemble de données Dog-pose et comment est-il utilisé avec Ultralytics YOLO11 ?

L'ensemble de données Dog-Pose comprend 6 773 images d'entraînement et 1 703 images de test annotées avec 24 points clés pour l'estimation de la pose du chien. Il est conçu pour l'entraînement et la validation de modèles avec Ultralytics YOLO11, prenant en charge des applications telles que l'analyse du comportement animal, la surveillance des animaux de compagnie et les études vétérinaires. Les annotations complètes de l'ensemble de données le rendent idéal pour développer des modèles précis d'estimation de la pose pour les canidés.

Comment entraîner un modèle YOLO11 en utilisant le jeu de données Dog-pose dans Ultralytics ?

Pour entraîner un modèle YOLO11n-pose sur le jeu de données Dog-pose pendant 100 epochs avec une taille d'image de 640, suivez ces exemples :

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Pour une liste complète des arguments d'entraînement, consultez la page Entraînement du modèle.

Quels sont les avantages de l'utilisation du jeu de données Dog-pose ?

L'ensemble de données Dog-pose offre plusieurs avantages :

Ensemble de données vaste et diversifié : Avec plus de 8 400 images, il fournit des données substantielles couvrant un large éventail de poses, de races et de contextes de chiens, permettant un entraînement et une évaluation robustes du modèle.

Annotations détaillées des points clés : Chaque image comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), offrant des annotations précises pour l’apprentissage de modèles précis de détection de pose.

Scénarios du monde réel : Comprend des images provenant d'environnements variés, ce qui améliore la capacité du modèle à se généraliser à des applications du monde réel telles que la surveillance des animaux de compagnie et l'analyse du comportement.

Avantage de l'apprentissage par transfert : L'ensemble de données fonctionne bien avec les techniques d'apprentissage par transfert, ce qui permet aux modèles pré-entraînés sur des ensembles de données de pose humaine de s'adapter aux caractéristiques spécifiques aux chiens.

Pour en savoir plus sur ses fonctionnalités et son utilisation, consultez la section Présentation du jeu de données.

Comment le mosaïquage profite-t-il au processus d'entraînement de YOLO11 en utilisant l'ensemble de données Dog-pose ?

L'assemblage en mosaïque, comme illustré dans les sample_images du jeu de données Dog-pose, fusionne plusieurs images en une seule composition, enrichissant la diversité des objets et des scènes dans chaque lot d'entraînement. Cette technique offre plusieurs avantages :

  • Augmente la variété des poses, des tailles et des arrière-plans de chiens dans chaque lot
  • Améliore la capacité du modèle à détecter les chiens dans différents contextes et à différentes échelles
  • Améliore la généralisation en exposant le modèle à des modèles visuels plus diversifiés
  • Réduit le surapprentissage en créant de nouvelles combinaisons d'exemples d'entraînement

Cette approche conduit à des modèles plus robustes qui fonctionnent mieux dans des scénarios réels. Pour des exemples d'images, consultez la section Exemples d'images et d'annotations.

Où puis-je trouver le fichier YAML de l'ensemble de données Dog-pose et comment l'utiliser ?

Le fichier YAML du jeu de données Dog-pose se trouve à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Ce fichier définit la configuration du jeu de données, y compris les chemins d'accès, les classes, les détails des points clés et d'autres informations pertinentes. Le YAML spécifie 24 points clés avec 3 dimensions par point clé, ce qui le rend adapté aux tâches d'estimation de pose détaillées.

Pour utiliser ce fichier avec les scripts d'entraînement YOLO11, il suffit de le référencer dans votre commande d'entraînement comme indiqué dans la section Utilisation. L'ensemble de données sera automatiquement téléchargé lors de la première utilisation, ce qui simplifie la configuration.

Pour plus de FAQ et une documentation détaillée, consultez la documentation Ultralytics.



📅 Créé il y a 9 mois ✏️ Mis à jour il y a 2 mois

Commentaires