Skip to content

Ensemble de données Tiger-Pose

Introduction

Ultralytics présente l'ensemble de données Tiger-Pose, une collection polyvalente conçue pour les tâches d'estimation de la pose. Cet ensemble de données comprend 263 images provenant d'une vidéo YouTube, 210 images étant affectées à l'entraînement et 53 à la validation. Il constitue une excellente ressource pour tester et dépanner les algorithmes d'estimation de la pose.

Malgré sa taille gérable de 210 images, l'ensemble de données tiger-pose offre une grande diversité, ce qui le rend adapté à l'évaluation des pipelines d'entraînement, à l'identification des erreurs potentielles et sert d'étape préliminaire précieuse avant de travailler avec des ensembles de données plus importants pour l'estimation de la pose.

Ce jeu de données est destiné à être utilisé avec Ultralytics HUB et YOLO11.



Regarder : Entraînez le modèle YOLO11 Pose sur l'ensemble de données Tiger-Pose à l'aide de Ultralytics HUB

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) permet de spécifier les détails de configuration d'un ensemble de données. Il comprend des données essentielles telles que les chemins d'accès aux fichiers, les définitions des classes et d'autres informations pertinentes. Plus précisément, pour l'ensemble de données tiger-pose.yaml vous pouvez vérifier Ultralytics Fichier de configuration de l'ensemble de données Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilisation

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Tiger-Pose pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, reportez-vous à la page Entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données Tiger-Pose, ainsi que les annotations correspondantes :

Image de l'échantillon de l'ensemble de données

  • Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant l'apprentissage qui combine plusieurs images en une seule afin d'augmenter la variété des objets et des scènes dans chaque lot d'apprentissage. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

Cet exemple illustre la variété et la complexité des images de l'ensemble de données Tiger-Pose et les avantages de l'utilisation du mosaïquage au cours du processus d'apprentissage.

Exemple d'inférence

Exemple d'inférence

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citations et remerciements

Le jeu de données a été publié sous la licenceAGPL-3.0 .

FAQ

À quoi sert l'ensemble de données Ultralytics Tiger-Pose ?

L'ensemble de données Ultralytics Tiger-Pose est conçu pour les tâches d'estimation de la pose et se compose de 263 images provenant d'une vidéo YouTube. L'ensemble de données est divisé en 210 images d'entraînement et 53 images de validation. Il est particulièrement utile pour tester, entraîner et affiner les algorithmes d'estimation de la pose à l'aide de Ultralytics HUB et de YOLO11.

Comment entraîner un modèle YOLO11 sur le jeu de données Tiger-Pose ?

Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Tiger-Pose pour 100 époques avec une taille d'image de 640, utilisez les extraits de code suivants. Pour plus de détails, consultez la page Entraînement:

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Quelles sont les configurations de l tiger-pose.yaml inclure dans le fichier ?

Le tiger-pose.yaml est utilisé pour spécifier les détails de configuration de l'ensemble de données Tiger-Pose. Il comprend des données essentielles telles que les chemins d'accès aux fichiers et les définitions des classes. Pour connaître la configuration exacte, vous pouvez consulter le fichier Ultralytics Fichier de configuration de l'ensemble de données Tiger-Pose.

Comment puis-je effectuer une inférence à l'aide d'un modèle YOLO11 formé sur l'ensemble de données Tiger-Pose ?

Pour effectuer une inférence à l'aide d'un modèle YOLO11 entraîné sur l'ensemble de données Tiger-Pose, vous pouvez utiliser les extraits de code suivants. Pour un guide détaillé, visitez la page Prédiction:

Exemple d'inférence

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Quels sont les avantages de l'utilisation de l'ensemble de données Tiger-Pose pour l'estimation de la pose ?

L'ensemble de données Tiger-Pose, malgré sa taille gérable de 210 images pour l'entraînement, fournit une collection diversifiée d'images qui sont idéales pour tester les pipelines d'estimation de la pose. L'ensemble de données permet d'identifier les erreurs potentielles et sert d'étape préliminaire avant de travailler avec des ensembles de données plus importants. En outre, l'ensemble de données permet d'entraîner et d'affiner les algorithmes d'estimation de la pose à l'aide d'outils avancés tels que Ultralytics HUB et YOLO11améliorant ainsi la performance et la précision du modèle.

📅C réé il y a 1 an ✏️ Mis à jour il y a 3 mois

Commentaires