Skip to content

Ensemble de données sur les chiens

Introduction

L'ensemble de données Ultralytics Dog-pose est un ensemble de données complet et de haute qualité spécialement conçu pour l'estimation des points clés des chiens. Avec 6 773 images d'entraînement et 1 703 images de test, cet ensemble de données constitue une base solide pour l'entraînement de modèles robustes d'estimation de la pose. Chaque image annotée comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), ce qui en fait une ressource précieuse pour la recherche et le développement avancés dans le domaine de la vision par ordinateur.

Ultralytics Image d'affichage de la position du chien

Ce jeu de données est destiné à être utilisé avec Ultralytics HUB et YOLO11.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il comprend les chemins d'accès, les détails des points clés et d'autres informations pertinentes. Dans le cas du jeu de données Dog-pose, le fichier The dog-pose.yaml est disponible à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilisation

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Dog-pose pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, reportez-vous à la page Entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données Dog-pose, ainsi que les annotations correspondantes :

Image de l'échantillon de l'ensemble de données

  • Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant l'apprentissage qui combine plusieurs images en une seule afin d'augmenter la variété des objets et des scènes dans chaque lot d'apprentissage. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

Cet exemple illustre la variété et la complexité des images de l'ensemble de données Dog-pose et les avantages de l'utilisation du mosaïquage au cours du processus d'apprentissage.

Citations et remerciements

Si vous utilisez l'ensemble de données Dog-pose dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Nous tenons à remercier l'équipe de Stanford pour avoir créé et maintenu cette ressource précieuse pour la communauté de la vision par ordinateur. Pour plus d'informations sur le jeu de données Dog-pose et ses créateurs, visitez le site Web Stanford Dogs Dataset.

FAQ

Qu'est-ce que l'ensemble de données Dog-pose et comment est-il utilisé avec Ultralytics YOLO11 ?

L'ensemble de données Dog-Pose comprend 6 773 images d'entraînement et 1 703 images de test annotées avec 24 points clés pour l'estimation de la pose d'un chien. Il est conçu pour l'entraînement et la validation des modèles avec Ultralytics YOLO11pour des applications telles que l'analyse du comportement des animaux, la surveillance des animaux de compagnie et les études vétérinaires. Les annotations complètes de l'ensemble de données en font un outil idéal pour développer des modèles précis d'estimation de la pose des chiens.

Comment entraîner un modèle YOLO11 en utilisant l'ensemble de données Dog-pose dans Ultralytics?

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Dog-pose pour 100 époques avec une taille d'image de 640, suivez ces exemples :

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Pour une liste complète des arguments de formation, consultez la page du modèle de formation.

Quels sont les avantages de l'utilisation du jeu de données Dog-pose ?

L'ensemble de données Dog-pose présente plusieurs avantages :

Un ensemble de données vaste et diversifié: Avec plus de 8 400 images, il fournit des données substantielles couvrant un large éventail de poses de chiens, de races et de contextes, ce qui permet une formation et une évaluation robustes des modèles.

Annotations détaillées des points clés: Chaque image comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), offrant des annotations précises pour l'apprentissage de modèles de détection de pose précis.

Scénarios du monde réel: Inclut des images provenant d'environnements variés, améliorant ainsi la capacité du modèle à s'appliquer à des applications réelles telles que la surveillance des animaux domestiques et l'analyse du comportement.

Avantage de l'apprentissage par transfert: L'ensemble de données fonctionne bien avec les techniques d'apprentissage par transfert, permettant aux modèles pré-entraînés sur des ensembles de données de pose humaine de s'adapter aux caractéristiques spécifiques des chiens.

Pour en savoir plus sur ses caractéristiques et son utilisation, voir la section Introduction aux jeux de données.

Comment le mosaïquage profite-t-il au processus de formation YOLO11 en utilisant l'ensemble de données Dog-pose ?

La mosaïque, comme l'illustrent les exemples d'images de l'ensemble de données Dog-pose, fusionne plusieurs images en un seul composite, enrichissant ainsi la diversité des objets et des scènes dans chaque lot d'apprentissage. Cette technique présente plusieurs avantages :

  • Augmente la variété des poses, des tailles et des arrière-plans des chiens dans chaque lot.
  • Amélioration de la capacité du modèle à détecter les chiens dans différents contextes et à différentes échelles
  • Améliore la généralisation en exposant le modèle à des modèles visuels plus diversifiés
  • Réduit le surajustement en créant de nouvelles combinaisons d'exemples de formation

Cette approche permet d'obtenir des modèles plus robustes et plus performants dans des scénarios réels. Pour des exemples d'images, voir la section Exemples d'images et d'annotations.

Où puis-je trouver le fichier YAML du jeu de données Dog-pose et comment puis-je l'utiliser ?

Le fichier YAML du jeu de données Dog-pose se trouve à l'adresse suivante ultralytics Ce fichier définit la configuration du jeu de données, y compris les chemins, les classes, les détails des points clés et d'autres informations pertinentes. Le fichier YAML spécifie 24 points clés avec 3 dimensions par point clé, ce qui le rend adapté aux tâches d'estimation détaillée de la pose.

Pour utiliser ce fichier avec les scripts d'entraînement de YOLO11 , il suffit d'y faire référence dans votre commande d'entraînement, comme indiqué dans la section Utilisation. Le jeu de données sera automatiquement téléchargé lors de la première utilisation, ce qui simplifie la configuration.

Pour plus de FAQ et une documentation détaillée, visitez le site Ultralytics Documentation.

📅C réé il y a 5 mois ✏️ Mis à jour il y a 16 jours

Commentaires