Vai al contenuto

Set di dati dei punti chiave della mano

Introduzione

Il dataset hand-keypoints contiene 26.768 immagini di mani annotate con keypoints, che lo rendono adatto all'addestramento di modelli come Ultralytics YOLO per compiti di stima della posa. Le annotazioni sono state generate utilizzando la libreria MediaPipe di Google , garantendo un'elevata accuratezza e coerenza. Ultralytics YOLO11 formati.



Guarda: Stima dei punti chiave della mano con Ultralytics YOLO11 | Esercitazione sulla stima della posa della mano umana

Punti di riferimento per le mani

Punti di riferimento per le mani

Punti chiave

Il set di dati comprende punti chiave per il rilevamento delle mani. I punti chiave sono annotati come segue:

  1. Polso
  2. Pollice (4 punti)
  3. Indice (4 punti)
  4. Dito medio (4 punti)
  5. Anulare (4 punti)
  6. Mignolo (4 punti)

Ogni mano ha un totale di 21 punti chiave.

Caratteristiche principali

  • Grande set di dati: 26.768 immagini con annotazioni di punti chiave a mano.
  • YOLO11 Compatibilità: Pronto per l'uso con i modelli YOLO11 .
  • 21 Punti chiave: Rappresentazione dettagliata della posa della mano.

Struttura del set di dati

Il set di dati dei punti chiave della mano è suddiviso in due sottoinsiemi:

  1. Treno: Questo sottoinsieme contiene 18.776 immagini dal set di dati sui punti chiave della mano, annotate per l'addestramento dei modelli di stima della posa.
  2. Val: questo sottoinsieme contiene 7992 immagini che possono essere utilizzate per la convalida durante l'addestramento del modello.

Applicazioni

I punti chiave della mano possono essere utilizzati per il riconoscimento dei gesti, i controlli AR/VR, la manipolazione robotica e l'analisi del movimento della mano nel settore sanitario. Possono essere applicati anche nell'animazione per la cattura del movimento e nei sistemi di autenticazione biometrica per la sicurezza.

Set di dati YAML

Un file YAML (Yet Another Markup Language) è usato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, sulle classi e altre informazioni rilevanti. Nel caso del set di dati Hand Keypoints, il file hand-keypoints.yaml Il file viene mantenuto all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/datasets/hand-keypoints.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints  ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
  [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

Utilizzo

Per addestrare un modello YOLO11n-pose sul dataset Hand Keypoints per 100 epoch con una dimensione dell'immagine di 640, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Immagini di esempio e annotazioni

Il set di dati Hand keypoints contiene un insieme eterogeneo di immagini con mani umane annotate con punti chiave. Ecco alcuni esempi di immagini del set di dati, con le relative annotazioni:

Immagine campione del set di dati

  • Immagine a mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicate. La mosaicatura è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ciascun batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti di aspetto e contesti diversi.

L'esempio mostra la varietà e la complessità delle immagini del set di dati Hand Keypoints e i vantaggi dell'uso della mosaicatura durante il processo di addestramento.

Citazioni e ringraziamenti

Se si utilizza il set di dati hand-keypoints nel proprio lavoro di ricerca o sviluppo, si prega di riconoscere le seguenti fonti:

Si ringraziano le seguenti fonti per aver fornito le immagini utilizzate in questo set di dati:

Le immagini sono state raccolte e utilizzate con le rispettive licenze fornite da ciascuna piattaforma e sono distribuite con la licenza Creative Commons Attribuzione-Non commerciale-Condividi allo stesso modo 4.0 Internazionale.

Desideriamo inoltre ringraziare il creatore di questo set di dati, Rion Dsilva, per il suo grande contributo alla ricerca sulla Vision AI.

FAQ

Come si addestra un modello YOLO11 sul dataset Hand Keypoints?

Per addestrare un modello YOLO11 sul set di dati Hand Keypoints, si può usare Python o l'interfaccia a riga di comando (CLI). Ecco un esempio di addestramento di un modello YOLO11n-pose per 100 epoch con un'immagine di dimensioni 640:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Per un elenco completo degli argomenti disponibili, consultare la pagina Formazione del modello.

Quali sono le caratteristiche principali del set di dati Hand Keypoints?

Il set di dati Hand Keypoints è stato progettato per compiti avanzati di stima della posa e include diverse caratteristiche chiave:

  • Set di dati di grandi dimensioni: Contiene 26.768 immagini con annotazioni di punti chiave a mano.
  • YOLO11 Compatibilità: Pronto per l'uso con i modelli YOLO11 .
  • 21 punti chiave: Rappresentazione dettagliata della posa della mano, comprese le articolazioni del polso e delle dita.

Per maggiori dettagli, è possibile consultare la sezione Hand Keypoints Dataset.

Quali applicazioni possono trarre vantaggio dall'utilizzo del set di dati Hand Keypoints?

Il set di dati Hand Keypoints può essere applicato in vari campi, tra cui:

  • Riconoscimento dei gesti: Migliorare l'interazione uomo-macchina.
  • Controlli AR/VR: Migliorare l'esperienza dell'utente nella realtà aumentata e virtuale.
  • Manipolazione robotica: Consentire un controllo preciso delle mani robotiche.
  • Assistenza sanitaria: Analisi dei movimenti della mano per la diagnostica medica.
  • Animazione: Acquisizione del movimento per animazioni realistiche.
  • Autenticazione biometrica: Migliorare i sistemi di sicurezza.

Per ulteriori informazioni, consultare la sezione Applicazioni.

Come è strutturato il dataset Hand Keypoints?

Il set di dati Hand Keypoints è suddiviso in due sottoinsiemi:

  1. Treno: Contiene 18.776 immagini per l'addestramento dei modelli di stima della posa.
  2. Val: contiene 7.992 immagini per la convalida durante l'addestramento del modello.

Questa struttura garantisce un processo di formazione e validazione completo. Per maggiori dettagli, consultare la sezione Struttura del dataset.

Come si utilizza il file YAML del dataset per l'addestramento?

La configurazione del set di dati è definita in un file YAML, che include percorsi, classi e altre informazioni rilevanti. Il file hand-keypoints.yaml Il file può essere trovato all'indirizzo hand-keypoints.yaml.

Per utilizzare questo file YAML per l'addestramento, specificarlo nello script di addestramento o nel comando CLI , come mostrato nell'esempio di addestramento precedente. Per maggiori dettagli, consultare la sezione YAML del dataset.

📅C reato 3 mesi fa ✏️ Aggiornato 1 mese fa

Commenti