Skip to content

Ensemble de données sur les chiens

Introduction

L'ensemble de données Ultralytics Dog-pose est un ensemble de données complet et de haute qualité spécialement conçu pour l'estimation des points clés des chiens. Avec 6 773 images d'entraînement et 1 703 images de test, cet ensemble de données constitue une base solide pour l'entraînement de modèles robustes d'estimation de la pose. Chaque image annotée comprend 24 points clés avec 3 dimensions par point clé (x, y, visibilité), ce qui en fait une ressource précieuse pour la recherche et le développement avancés dans le domaine de la vision par ordinateur.

Ultralytics Image d'affichage de la position du chien

Ce jeu de données est destiné à être utilisé avec Ultralytics HUB et YOLO11.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il comprend les chemins d'accès, les détails des points clés et d'autres informations pertinentes. Dans le cas du jeu de données Dog-pose, le fichier The dog-pose.yaml est disponible à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Utilisation

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Dog-pose pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, reportez-vous à la page Entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données Dog-pose, ainsi que les annotations correspondantes :

Image de l'échantillon de l'ensemble de données

  • Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant l'apprentissage qui combine plusieurs images en une seule afin d'augmenter la variété des objets et des scènes dans chaque lot d'apprentissage. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

Cet exemple illustre la variété et la complexité des images de l'ensemble de données Dog-pose et les avantages de l'utilisation du mosaïquage au cours du processus d'apprentissage.

Citations et remerciements

Si vous utilisez l'ensemble de données Dog-pose dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Nous tenons à remercier l'équipe de Stanford pour avoir créé et maintenu cette ressource précieuse pour la communauté de la vision par ordinateur. Pour plus d'informations sur le jeu de données Dog-pose et ses créateurs, visitez le site Web Stanford Dogs Dataset.

FAQ

Qu'est-ce que l'ensemble de données Dog-pose et comment est-il utilisé avec Ultralytics YOLO11 ?

L'ensemble de données Dog-Pose comprend 6 000 images annotées avec 17 points clés pour l'estimation de la pose d'un chien. Idéal pour l'entraînement et la validation de modèles avec Ultralytics YOLO11Il est destiné à des applications telles que l'analyse du comportement animal et les études vétérinaires.

Comment entraîner un modèle YOLO11 en utilisant l'ensemble de données Dog-pose dans Ultralytics?

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Dog-pose pour 100 époques avec une taille d'image de 640, suivez ces exemples :

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Pour une liste complète des arguments de formation, consultez la page du modèle de formation.

Quels sont les avantages de l'utilisation du jeu de données Dog-pose ?

L'ensemble de données Dog-pose présente plusieurs avantages :

Un ensemble de données vaste et diversifié: Avec 6 000 images, il fournit une quantité substantielle de données couvrant un large éventail de poses de chiens, de races et de contextes, ce qui permet une formation et une évaluation robustes des modèles.

Annotations spécifiques à la pose: Offre des annotations détaillées pour l'estimation de la pose, garantissant des données de haute qualité pour l'entraînement des modèles de détection de la pose.

Scénarios du monde réel: Inclut des images provenant d'environnements variés, améliorant ainsi la capacité du modèle à s'adapter aux applications du monde réel.

Amélioration des performances du modèle: La diversité et l'échelle de l'ensemble de données permettent d'améliorer la précision et la robustesse du modèle, en particulier pour les tâches impliquant une estimation fine de la pose.

Pour en savoir plus sur ses caractéristiques et son utilisation, voir la section Introduction aux jeux de données.

Comment le mosaïquage profite-t-il au processus de formation YOLO11 en utilisant l'ensemble de données Dog-pose ?

La mosaïque, comme l'illustrent les exemples d'images de l'ensemble de données Dog-pose, fusionne plusieurs images en un seul composite, enrichissant ainsi la diversité des objets et des scènes dans chaque lot d'apprentissage. Cette approche améliore la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes, ce qui se traduit par une amélioration des performances. Pour des exemples d'images, voir la section Exemples d'images et d'annotations.

Où puis-je trouver le fichier YAML du jeu de données Dog-pose et comment puis-je l'utiliser ?

Le fichier YAML du jeu de données Dog-pose se trouve ici. Ce fichier définit la configuration du jeu de données, y compris les chemins, les classes et d'autres informations pertinentes. Utilisez ce fichier avec les scripts de formation YOLO11 comme indiqué dans la section Train Example.

Pour plus de FAQ et une documentation détaillée, visitez le site Ultralytics Documentation.

📅C réé il y a 1 mois ✏️ Mis à jour il y a 1 mois

Commentaires