Skip to content

Ensemble de données Tiger-Pose

Introduction

Ultralytics présente l'ensemble de données Tiger-Pose, une collection polyvalente conçue pour les tâches d'estimation de la pose. Cet ensemble de données comprend 263 images provenant d'une vidéo YouTube, avec 210 images allouées à la formation et 53 à la validation. Il constitue une excellente ressource pour tester et dépanner les algorithmes d'estimation de la pose.

Malgré sa taille gérable de 210 images, l'ensemble de données tiger-pose offre de la diversité, ce qui le rend approprié pour évaluer les pipelines d'entraînement, identifier les erreurs potentielles et servir d'étape préliminaire précieuse avant de travailler avec des ensembles de données plus importants pour l'estimation de la pose.

Cet ensemble de données est destiné à être utilisé avec Ultralytics HUB et YOLOv8.



Regarde : Entraîne le modèle YOLOv8 Pose sur l'ensemble de données Tiger-Pose à l'aide de Ultralytics HUB

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) sert à spécifier les détails de configuration d'un ensemble de données. Il englobe des données cruciales telles que les chemins d'accès aux fichiers, les définitions des classes et d'autres informations pertinentes. Plus précisément, pour le fichier tiger-pose.yaml tu peux vérifier Ultralytics Fichier de configuration de l'ensemble de données Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Utilisation

Pour entraîner un modèle YOLOv8n-pose sur l'ensemble de données Tiger-Pose pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données Tiger-Pose, ainsi que les annotations correspondantes :

Image de l'échantillon du jeu de données

  • Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant la formation qui combine plusieurs images en une seule afin d'augmenter la variété d'objets et de scènes dans chaque lot de formation. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

L'exemple montre la variété et la complexité des images de l'ensemble de données Tiger-Pose et les avantages de l'utilisation du mosaïquage pendant le processus de formation.

Exemple de déduction

Exemple de déduction

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

Citations et remerciements

Le jeu de données a été publié sous la licenceAGPL-3.0 .



Créé le 2023-11-12, Mis à jour le 2024-02-03
Auteurs : glenn-jocher (5), RizwanMunawar (1)

Commentaires