Jeu de données sur les points clés de la main
Introduction
L'ensemble de données hand-keypoints contient 26 768 images de mains annotées avec des keypoints, ce qui permet d'entraîner des modèles tels que Ultralytics YOLO pour les tâches d'estimation de la pose. Les annotations ont été générées à l'aide de la bibliothèque MediaPipe de Google , ce qui garantit une précision et une cohérence élevées. Ultralytics YOLO11 compatible avec les formats.
Regarder : Hand Keypoints Estimation with Ultralytics YOLO11 | Tutoriel sur l'estimation de la pose de la main humaine
Points de repère de la main
Points clés
L'ensemble de données comprend des points clés pour la détection des mains. Les points clés sont annotés comme suit :
- Poignet
- Pouce (4 points)
- Index (4 points)
- Doigt du milieu (4 points)
- Annulaire (4 points)
- Petit doigt (4 points)
Chaque main comporte un total de 21 points clés.
Caractéristiques principales
- Grand ensemble de données: 26 768 images avec des annotations sur les points clés de la main.
- YOLO11 Compatibilité: Prêt à être utilisé avec les modèles YOLO11 .
- 21 points clés: Représentation détaillée de la pose de la main.
Structure de l'ensemble de données
L'ensemble de données sur les points-clés de la main est divisé en deux sous-ensembles :
- Entraînement: Ce sous-ensemble contient 18 776 images de l'ensemble de données sur les points clés de la main, annotées pour l'entraînement des modèles d'estimation de la pose.
- Val: ce sous-ensemble contient 7992 images qui peuvent être utilisées à des fins de validation pendant l'apprentissage du modèle.
Applications
Les points-clés de la main peuvent être utilisés pour la reconnaissance des gestes, les commandes AR/VR, la manipulation robotique et l'analyse des mouvements de la main dans le domaine de la santé. Ils peuvent également être appliqués à l'animation pour la capture de mouvements et aux systèmes d'authentification biométrique pour la sécurité.
Jeu de données YAML
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données Hand Keypoints, le fichier hand-keypoints.yaml
est conservé à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
ultralytics/cfg/datasets/hand-keypoints.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
[0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip
Utilisation
Pour entraîner un modèle YOLO11n-pose sur l'ensemble de données Hand Keypoints pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.
Exemple de train
Exemples d'images et d'annotations
Le jeu de données Hand keypoints contient un ensemble varié d'images de mains humaines annotées avec des points clés. Voici quelques exemples d'images tirées de l'ensemble de données, ainsi que les annotations correspondantes :
- Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant l'apprentissage qui combine plusieurs images en une seule afin d'augmenter la variété des objets et des scènes dans chaque lot d'apprentissage. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.
Cet exemple illustre la variété et la complexité des images de l'ensemble de données Hand Keypoints et les avantages de l'utilisation du mosaïquage au cours du processus d'apprentissage.
Citations et remerciements
Si vous utilisez l'ensemble de données Handkeypoints dans le cadre de vos travaux de recherche ou de développement, veuillez citer les sources suivantes :
Nous tenons à remercier les sources suivantes pour avoir fourni les images utilisées dans cet ensemble de données :
Les images ont été collectées et utilisées sous les licences respectives fournies par chaque plateforme et sont distribuées sous la licence Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Nous tenons également à remercier le créateur de cet ensemble de données, Rion Dsilva, pour sa grande contribution à la recherche sur l'IA de la vision.
FAQ
Comment entraîner un modèle YOLO11 sur le jeu de données Hand Keypoints ?
Pour entraîner un modèle YOLO11 sur le jeu de données Hand Keypoints, vous pouvez utiliser soit Python , soit l'interface de ligne de commande (CLI). Voici un exemple d'entraînement d'un modèle YOLO11n-pose pour 100 époques avec une taille d'image de 640 :
Exemple
Pour une liste complète des arguments disponibles, voir la page Formation au modèle.
Quelles sont les principales caractéristiques de l'ensemble de données Hand Keypoints ?
L'ensemble de données Hand Keypoints est conçu pour des tâches avancées d'estimation de la pose et comprend plusieurs caractéristiques essentielles :
- Grand ensemble de données: Contient 26 768 images avec des annotations de points clés à la main.
- YOLO11 Compatibilité: Prêt à être utilisé avec les modèles YOLO11 .
- 21 points clés: Représentation détaillée de la pose de la main, y compris les articulations du poignet et des doigts.
Pour plus de détails, vous pouvez consulter la section "Hand Keypoints Dataset".
Quelles applications peuvent bénéficier de l'utilisation du jeu de données Hand Keypoints ?
Le jeu de données Hand Keypoints peut être utilisé dans différents domaines :
- Reconnaissance des gestes: Améliorer l'interaction homme-machine.
- Contrôles AR/VR: Améliorer l'expérience de l'utilisateur dans la réalité augmentée et virtuelle.
- Manipulation robotique: Permettre un contrôle précis des mains robotisées.
- Santé: Analyse des mouvements de la main à des fins de diagnostic médical.
- Animation: Capturer le mouvement pour des animations réalistes.
- Authentification biométrique: Améliorer les systèmes de sécurité.
Pour plus d'informations, voir la section Applications.
Comment l'ensemble de données Hand Keypoints est-il structuré ?
L'ensemble de données Hand Keypoints est divisé en deux sous-ensembles :
- Train: Contient 18 776 images pour l'entraînement des modèles d'estimation de la pose.
- Val: contient 7 992 images à des fins de validation lors de l'apprentissage du modèle.
Cette structure garantit un processus complet de formation et de validation. Pour plus de détails, voir la section Structure des ensembles de données.
Comment utiliser le fichier YAML du jeu de données pour la formation ?
La configuration du jeu de données est définie dans un fichier YAML, qui comprend les chemins, les classes et d'autres informations pertinentes. Le fichier hand-keypoints.yaml
est disponible à l'adresse suivante hand-keypoints.yaml.
Pour utiliser ce fichier YAML pour la formation, spécifiez-le dans votre script de formation ou dans la commande CLI , comme indiqué dans l'exemple de formation ci-dessus. Pour plus de détails, reportez-vous à la section Dataset YAML.