Meet YOLO26: next-gen vision AI.

Link to this sectionConjunto de datos de puntos clave de la mano#

Link to this sectionIntroducción#

El conjunto de datos de puntos clave de la mano contiene 26,768 imágenes de manos anotadas con puntos clave, lo que lo hace adecuado para entrenar modelos como Ultralytics YOLO para tareas de estimación de pose. Las anotaciones se generaron utilizando la biblioteca Google MediaPipe, lo que garantiza una alta precisión y coherencia, y el conjunto de datos es compatible con los formatos de Ultralytics YOLO26.



Watch: Hand Keypoints Estimation with Ultralytics YOLO26 | Human Hand Pose Estimation Tutorial

Link to this sectionPuntos de referencia de la mano#

Diagrama de puntos de referencia de la mano con 21 puntos

Link to this sectionPuntos clave#

El conjunto de datos incluye puntos clave para la detección de manos. Los puntos clave están anotados de la siguiente manera:

  1. Muñeca
  2. Pulgar (4 puntos)
  3. Índice (4 puntos)
  4. Corazón (4 puntos)
  5. Anular (4 puntos)
  6. Meñique (4 puntos)

Cada mano tiene un total de 21 puntos clave.

Link to this sectionCaracterísticas clave#

  • Conjunto de datos grande: 26,768 imágenes con anotaciones de puntos clave de la mano.
  • Compatibilidad con YOLO26: Las etiquetas se entregan en formato de puntos clave de YOLO y están listas para su uso con modelos YOLO26.
  • 21 puntos clave: Representación detallada de la pose de la mano que abarca la muñeca y cuatro puntos por dedo.

Link to this sectionEstructura del dataset#

El conjunto de datos de puntos clave de la mano se divide en dos subconjuntos:

  1. Train: Este subconjunto contiene 18,776 imágenes del conjunto de datos de puntos clave de la mano, anotadas para el entrenamiento de modelos de estimación de pose.
  2. Val: Este subconjunto contiene 7,992 imágenes que pueden utilizarse para fines de validación durante el entrenamiento del modelo.

Link to this sectionAplicaciones#

Los puntos clave de la mano se pueden usar para el reconocimiento de gestos, controles AR/VR, manipulación robótica y análisis del movimiento de la mano en el sector sanitario. También se pueden aplicar en animación para captura de movimiento y sistemas de autenticación biométrica por seguridad. El seguimiento detallado de las posiciones de los dedos permite una interacción precisa con objetos virtuales e interfaces de control sin contacto.

Link to this sectionYAML del dataset#

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas, las clases y otra información relevante del conjunto de datos. En el caso del conjunto de datos de puntos clave de la mano, el archivo hand-keypoints.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/datasets/hand-keypoints.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Keypoint names per class
kpt_names:
  0:
    - wrist
    - thumb_cmc
    - thumb_mcp
    - thumb_ip
    - thumb_tip
    - index_mcp
    - index_pip
    - index_dip
    - index_tip
    - middle_mcp
    - middle_pip
    - middle_dip
    - middle_tip
    - ring_mcp
    - ring_pip
    - ring_dip
    - ring_tip
    - pinky_mcp
    - pinky_pip
    - pinky_dip
    - pinky_tip

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

Link to this sectionUso#

Para entrenar un modelo YOLO26n-pose en el conjunto de datos de puntos clave de la mano durante 100 épocas con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)

Link to this sectionMuestras de imágenes y anotaciones#

El conjunto de datos de puntos clave de la mano contiene un conjunto diverso de imágenes con manos humanas anotadas con puntos clave. Aquí tienes algunos ejemplos de imágenes del conjunto de datos, junto con sus correspondientes anotaciones:

Muestra del conjunto de datos de estimación de pose de puntos clave de la mano

  • Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes del conjunto de datos en mosaico. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos de puntos clave de la mano y los beneficios de usar mosaico durante el proceso de entrenamiento.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos de puntos clave de la mano en tu trabajo de investigación o desarrollo, por favor reconoce las siguientes fuentes:

Cita

Nos gustaría agradecer a las siguientes fuentes por proporcionar las imágenes utilizadas en este conjunto de datos:

Las imágenes se recopilaron y utilizaron bajo las licencias respectivas proporcionadas por cada plataforma y se distribuyen bajo la licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International.

También nos gustaría reconocer al creador de este conjunto de datos, Rion Dsilva, por su gran contribución a la investigación en IA visual.

Link to this sectionFAQ#

Link to this section¿Cómo entreno un modelo YOLO26 en el conjunto de datos de puntos clave de la mano?#

Para entrenar un modelo YOLO26 en el conjunto de datos de puntos clave de la mano, puedes usar Python o la interfaz de línea de comandos (CLI). Aquí tienes un ejemplo para entrenar un modelo YOLO26n-pose durante 100 épocas con un tamaño de imagen de 640:

Ejemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)

Para obtener una lista completa de los argumentos disponibles, consulta la página de Training del modelo.

Link to this section¿Cuáles son las características clave del conjunto de datos de puntos clave de la mano?#

El conjunto de datos Hand Keypoints está diseñado para tareas avanzadas de pose estimation e incluye varias características clave:

  • Conjunto de datos grande: Contiene 26,768 imágenes con anotaciones de puntos clave de la mano.
  • Compatibilidad con YOLO26: Listo para su uso con modelos YOLO26.
  • 21 puntos clave: Representación detallada de la pose de la mano, incluyendo la muñeca y las articulaciones de los dedos.

Para más detalles, puedes explorar la sección Conjunto de datos de puntos clave de la mano.

Link to this section¿Qué aplicaciones pueden beneficiarse del uso del conjunto de datos de puntos clave de la mano?#

El conjunto de datos de puntos clave de la mano puede aplicarse en diversos campos, incluyendo:

  • Reconocimiento de gestos: Mejora la interacción humano-computadora.
  • Controles de AR/VR: Mejora la experiencia del usuario en realidad aumentada y virtual.
  • Manipulación robótica: Permite un control preciso de manos robóticas.
  • Salud: Análisis de movimientos de la mano para diagnósticos médicos.
  • Animación: Captura de movimiento para animaciones realistas.
  • Autenticación biométrica: Mejora de los sistemas de seguridad.

Para más información, consulta la sección Aplicaciones.

Link to this section¿Cómo está estructurado el conjunto de datos de puntos clave de la mano?#

El conjunto de datos de puntos clave de la mano se divide en dos subconjuntos:

  1. Train: Contiene 18,776 imágenes para el entrenamiento de modelos de estimación de pose.
  2. Val: Contiene 7,992 imágenes para fines de validación durante el entrenamiento del modelo.

Esta estructura garantiza un proceso exhaustivo de entrenamiento y validación. Para más detalles, consulta la sección Estructura del conjunto de datos.

Link to this section¿Cómo uso el archivo YAML del conjunto de datos para el entrenamiento?#

La configuración del conjunto de datos se define en un archivo YAML, que incluye rutas, clases y otra información relevante. El archivo hand-keypoints.yaml se encuentra en hand-keypoints.yaml.

Para usar este archivo YAML para el entrenamiento, especifícalo en tu script de entrenamiento o comando CLI como se muestra en el ejemplo de entrenamiento anterior. Para más detalles, consulta la sección YAML del conjunto de datos.

Comentarios