Ensemble de données de pose du tigre
Introduction
Ultralytics présente le jeu de données Tiger-Pose, une collection polyvalente conçue pour les tâches d'estimation de pose. Ce jeu de données comprend 263 images provenant d'une vidéo YouTube, avec 210 images allouées à l'entraînement et 53 à la validation. Il constitue une excellente ressource pour tester et dépanner les algorithmes d'estimation de pose.
Malgré sa taille gérable de 210 images, l'ensemble de données Tiger-Pose offre une diversité, ce qui le rend approprié pour évaluer les pipelines d'apprentissage, identifier les erreurs potentielles et servir d'étape préliminaire précieuse avant de travailler avec des ensembles de données plus volumineux pour l'estimation de pose.
Cet ensemble de données est destiné à être utilisé avec Ultralytics HUB et YOLO11.
Regarder : Entraîner le modèle de pose YOLO11 sur l'ensemble de données Tiger-Pose en utilisant Ultralytics HUB
YAML du jeu de données
Un fichier YAML (Yet Another Markup Language) sert à spécifier les détails de configuration d'un ensemble de données. Il englobe des données cruciales telles que les chemins d'accès aux fichiers, les définitions de classes et d'autres informations pertinentes. Plus précisément, pour le tiger-pose.yaml
fichier, vous pouvez vérifier Fichier de configuration de l'ensemble de données Ultralytics Tiger-Pose.
ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip
Utilisation
Pour entraîner un modèle YOLO11n-pose sur le jeu de données Tiger-Pose pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Images et annotations d'exemple
Voici quelques exemples d'images du jeu de données Tiger-Pose, ainsi que leurs annotations correspondantes :
- Image mosaïque : Cette image montre un lot d'entraînement composé d'images d'ensemble de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes dans chaque lot d'entraînement. Cela permet d'améliorer la capacité du modèle à se généraliser à différentes tailles d'objets, rapports hauteur/largeur et contextes.
Cet exemple illustre la variété et la complexité des images dans l'ensemble de données Tiger-Pose, ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.
Exemple d'inférence
Exemple d'inférence
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Citations et remerciements
L'ensemble de données a été publié sous la licence AGPL-3.0.
FAQ
À quoi sert le jeu de données Ultralytics Tiger-Pose ?
L'ensemble de données Ultralytics Tiger-Pose est conçu pour les tâches d'estimation de pose, composé de 263 images provenant d'une vidéo YouTube. L'ensemble de données est divisé en 210 images d'entraînement et 53 images de validation. Il est particulièrement utile pour tester, entraîner et affiner les algorithmes d'estimation de pose à l'aide d'Ultralytics HUB et de YOLO11.
Comment entraîner un modèle YOLO11 sur l'ensemble de données Tiger-Pose ?
Pour entraîner un modèle YOLO11n-pose sur le jeu de données Tiger-Pose pendant 100 epochs avec une taille d'image de 640, utilisez les extraits de code suivants. Pour plus de détails, consultez la page Formation :
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Quelles configurations le tiger-pose.yaml
fichier inclut ?
L'argument tiger-pose.yaml
Le fichier est utilisé pour spécifier les détails de configuration de l'ensemble de données Tiger-Pose. Il comprend des données cruciales telles que les chemins d'accès aux fichiers et les définitions de classes. Pour voir la configuration exacte, vous pouvez consulter le Fichier de configuration de l'ensemble de données Ultralytics Tiger-Pose.
Comment puis-je exécuter l'inférence en utilisant un modèle YOLO11 entraîné sur l'ensemble de données Tiger-Pose ?
Pour effectuer une inférence à l'aide d'un modèle YOLO11 entraîné sur l'ensemble de données Tiger-Pose, vous pouvez utiliser les extraits de code suivants. Pour un guide détaillé, visitez la page Prédiction :
Exemple d'inférence
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Quels sont les avantages de l'utilisation du jeu de données Tiger-Pose pour l'estimation de pose ?
L'ensemble de données Tiger-Pose, malgré sa taille gérable de 210 images pour l'entraînement, fournit une collection diversifiée d'images idéales pour tester les pipelines d'estimation de pose. L'ensemble de données aide à identifier les erreurs potentielles et sert d'étape préliminaire avant de travailler avec des ensembles de données plus volumineux. De plus, l'ensemble de données prend en charge l'entraînement et l'affinage des algorithmes d'estimation de pose à l'aide d'outils avancés tels que Ultralytics HUB et YOLO11, améliorant ainsi les performances du modèle et la précision.