Conjunto de datos de puntos clave de la mano
Introducción
El conjunto de datos de puntos clave de la mano contiene 26.768 imágenes de manos anotadas con puntos clave, lo que lo hace adecuado para entrenar modelos como Ultralytics YOLO para tareas de estimación de pose. Las anotaciones se generaron utilizando la biblioteca Google MediaPipe, garantizando una alta precisión y consistencia, y el conjunto de datos es compatible con los formatos de Ultralytics YOLO26.
Watch: Hand Keypoints Estimation with Ultralytics YOLO26 | Human Hand Pose Estimation Tutorial
Puntos de referencia de la mano

Keypoints
El conjunto de datos incluye puntos clave para la detección de manos. Los puntos clave están anotados de la siguiente manera:
- Muñeca
- Pulgar (4 puntos)
- Índice (4 puntos)
- Corazón (4 puntos)
- Anular (4 puntos)
- Meñique (4 puntos)
Cada mano tiene un total de 21 puntos clave.
Características clave
- Conjunto de datos grande: 26.768 imágenes con anotaciones de puntos clave de la mano.
- Compatibilidad con YOLO26: Las etiquetas vienen en formato de puntos clave YOLO y están listas para usarse con modelos YOLO26.
- 21 puntos clave: Representación detallada de la pose de la mano que abarca la muñeca y cuatro puntos por dedo.
Estructura del conjunto de datos
El conjunto de datos de puntos clave de la mano se divide en dos subconjuntos:
- Train: Este subconjunto contiene 18.776 imágenes del conjunto de datos de puntos clave de la mano, anotadas para entrenar modelos de estimación de pose.
- Val: Este subconjunto contiene 7.992 imágenes que se pueden utilizar para fines de validación durante el entrenamiento del modelo.
Aplicaciones
Los puntos clave de la mano se pueden utilizar para reconocimiento de gestos, controles AR/VR, manipulación robótica y análisis del movimiento de la mano en el ámbito sanitario. También se pueden aplicar en animación para captura de movimiento y sistemas de autenticación biométrica para seguridad. El seguimiento detallado de las posiciones de los dedos permite una interacción precisa con objetos virtuales e interfaces de control sin contacto.
YAML del conjunto de datos
Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas del conjunto de datos, las clases y otra información relevante. En el caso del conjunto de datos Hand Keypoints, el archivo hand-keypoints.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Keypoint names per class
kpt_names:
0:
- wrist
- thumb_cmc
- thumb_mcp
- thumb_ip
- thumb_tip
- index_mcp
- index_pip
- index_dip
- index_tip
- middle_mcp
- middle_pip
- middle_dip
- middle_tip
- ring_mcp
- ring_pip
- ring_dip
- ring_tip
- pinky_mcp
- pinky_pip
- pinky_dip
- pinky_tip
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zipUso
Para entrenar un modelo YOLO26n-pose en el conjunto de datos Hand Keypoints durante 100 épocas con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)Imágenes y anotaciones de muestra
El conjunto de datos Hand Keypoints contiene un conjunto diverso de imágenes con manos humanas anotadas con puntos clave. Aquí tienes algunos ejemplos de imágenes del conjunto de datos, junto con sus anotaciones correspondientes:

- Imagen en mosaico: esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Hand Keypoints y los beneficios de usar mosaico durante el proceso de entrenamiento.
Citas y reconocimientos
Si utilizas el conjunto de datos hand-keypoints en tu trabajo de investigación o desarrollo, por favor reconoce las siguientes fuentes:
Nos gustaría agradecer a las siguientes fuentes por proporcionar las imágenes utilizadas en este conjunto de datos:
Las imágenes fueron recopiladas y utilizadas bajo las licencias respectivas proporcionadas por cada plataforma y se distribuyen bajo la Licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
También nos gustaría reconocer al creador de este conjunto de datos, Rion Dsilva, por su gran contribución a la investigación de Vision AI.
Preguntas frecuentes
¿Cómo entreno un modelo YOLO26 en el conjunto de datos Hand Keypoints?
Para entrenar un modelo YOLO26 en el conjunto de datos Hand Keypoints, puedes usar Python o la interfaz de línea de comandos (CLI). Aquí tienes un ejemplo para entrenar un modelo YOLO26n-pose durante 100 épocas con un tamaño de imagen de 640:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.
¿Cuáles son las características clave del conjunto de datos Hand Keypoints?
El conjunto de datos Hand Keypoints está diseñado para tareas avanzadas de estimación de pose e incluye varias características clave:
- Conjunto de datos grande: Contiene 26.768 imágenes con anotaciones de puntos clave de la mano.
- Compatibilidad con YOLO26: Listo para usarse con modelos YOLO26.
- 21 puntos clave: Representación detallada de la pose de la mano, incluyendo la muñeca y las articulaciones de los dedos.
Para más detalles, puedes explorar la sección Conjunto de datos de puntos clave de la mano.
¿Qué aplicaciones pueden beneficiarse del uso del conjunto de datos Hand Keypoints?
El conjunto de datos Hand Keypoints se puede aplicar en varios campos, incluyendo:
- Reconocimiento de gestos: Mejorando la interacción humano-computadora.
- Controles AR/VR: Mejorando la experiencia del usuario en realidad aumentada y virtual.
- Manipulación robótica: Permitiendo un control preciso de manos robóticas.
- Sanidad: Analizando los movimientos de la mano para diagnósticos médicos.
- Animación: Capturando movimiento para animaciones realistas.
- Autenticación biométrica: Mejorando los sistemas de seguridad.
Para más información, consulta la sección Aplicaciones.
¿Cómo está estructurado el conjunto de datos Hand Keypoints?
El conjunto de datos Hand Keypoints se divide en dos subconjuntos:
- Train: Contiene 18.776 imágenes para entrenar modelos de estimación de pose.
- Val: Contiene 7.992 imágenes para fines de validación durante el entrenamiento del modelo.
Esta estructura garantiza un proceso integral de entrenamiento y validación. Para más detalles, mira la sección Estructura del conjunto de datos.
¿Cómo uso el archivo YAML del conjunto de datos para el entrenamiento?
La configuración del conjunto de datos se define en un archivo YAML, que incluye rutas, clases y otra información relevante. El archivo hand-keypoints.yaml se puede encontrar en hand-keypoints.yaml.
Para usar este archivo YAML para el entrenamiento, especifícalo en tu script de entrenamiento o comando CLI como se muestra en el ejemplo de entrenamiento anterior. Para más detalles, consulta la sección YAML del conjunto de datos.