콘텐츠로 건너뛰기

손 키포인트 데이터 세트

소개

hand-keypoints 데이터 세트는 키포인트로 어노테이션 처리된 26,768개의 손 이미지를 포함하고 있어 포즈 추정 작업을 위한 Ultralytics YOLO와 같은 모델을 훈련하는 데 적합합니다. 어노테이션은 Google MediaPipe 라이브러리를 사용하여 생성되어 높은 정확도와 일관성을 보장하며, 이 데이터 세트는 Ultralytics YOLO11 형식과 호환됩니다.



참고: Ultralytics YOLO11을 사용한 손 키포인트 추정 | 사람 손 자세 추정 튜토리얼

손 랜드마크

손 랜드마크

키포인트

이 데이터 세트에는 손 감지를 위한 키포인트가 포함되어 있습니다. 키포인트는 다음과 같이 주석 처리됩니다.

  1. 손목
  2. 엄지 (4 포인트)
  3. 검지 (4개 포인트)
  4. 중지 (4 포인트)
  5. 약지 (4 포인트)
  6. 새끼 손가락 (4 포인트)

각 손에는 총 21개의 키포인트가 있습니다.

주요 기능

  • 대규모 데이터셋: 손 키포인트 어노테이션이 있는 26,768장의 이미지.
  • YOLO11 호환성: YOLO11 모델과 함께 사용할 준비가 되었습니다.
  • 21개의 키포인트: 손 자세에 대한 상세한 표현입니다.

데이터 세트 구조

손 키포인트 데이터 세트는 두 개의 하위 세트로 나뉩니다.

  1. Train: 이 하위 집합은 포즈 추정 모델 학습을 위해 어노테이션이 추가된 핸드 키포인트 데이터 세트의 18,776개의 이미지를 포함합니다.
  2. Val: 이 하위 집합은 모델 훈련 중 검증 목적으로 사용할 수 있는 7,992개의 이미지를 포함합니다.

응용 분야

손 키포인트는 제스처 인식, AR/VR 제어, 로봇 조작, 헬스케어 분야의 손 움직임 분석에 사용될 수 있습니다. 또한 모션 캡처 애니메이션 및 보안을 위한 생체 인증 시스템에도 적용할 수 있습니다. 손가락 위치를 상세하게 추적하여 가상 객체와의 정밀한 상호 작용 및 비접촉식 제어 인터페이스를 구현할 수 있습니다.

데이터세트 YAML

YAML(Yet Another Markup Language) 파일은 데이터 세트 구성을 정의하는 데 사용됩니다. 여기에는 데이터 세트의 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. Hand Keypoints 데이터 세트의 경우, hand-keypoints.yaml 파일은 다음 위치에서 관리됩니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/datasets/hand-keypoints.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
  [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

사용법

이미지 크기를 640으로 설정하고 Hand Keypoints 데이터 세트에서 YOLO11n-pose 모델을 100 epoch 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 전체 인수 목록은 모델 학습 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

샘플 이미지 및 주석

손 키포인트 데이터 세트에는 키포인트로 주석이 달린 사람 손의 다양한 이미지 세트가 포함되어 있습니다. 다음은 데이터 세트의 이미지와 해당 주석의 몇 가지 예입니다.

데이터 세트 샘플 이미지

  • 모자이크 이미지: 이 이미지는 모자이크 데이터 세트 이미지로 구성된 훈련 배치를 보여줍니다. 모자이킹은 각 훈련 배치 내에서 객체와 장면의 다양성을 높이기 위해 여러 이미지를 단일 이미지로 결합하는 훈련 중 사용되는 기술입니다. 이는 모델이 다양한 객체 크기, 종횡비 및 컨텍스트로 일반화하는 능력을 향상시키는 데 도움이 됩니다.

이 예는 Hand Keypoints 데이터 세트의 이미지의 다양성과 복잡성, 그리고 훈련 과정에서 모자이크를 사용하는 이점을 보여줍니다.

인용 및 감사의 말씀

hand-keypoints 데이터 세트를 연구 또는 개발 작업에 사용하는 경우 다음 출처를 인정하십시오.

이 데이터 세트에 사용된 이미지를 제공해 주신 다음 출처에 감사드립니다.

이미지는 각 플랫폼에서 제공하는 해당 라이선스에 따라 수집 및 사용되었으며 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License에 따라 배포됩니다.

Vision AI 연구에 크게 기여한 이 데이터 세트의 제작자인 Rion Dsilva에게도 감사를 표합니다.

FAQ

Hand Keypoints 데이터 세트에서 YOLO11 모델을 어떻게 학습시키나요?

Hand Keypoints 데이터 세트에서 YOLO11 모델을 훈련하려면 Python 또는 CLI(명령줄 인터페이스)를 사용할 수 있습니다. 다음은 이미지 크기가 640인 YOLO11n-pose 모델을 100 epoch 동안 훈련하는 예제입니다.

예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

사용 가능한 인수에 대한 포괄적인 목록은 모델 훈련 페이지를 참조하세요.

Hand Keypoints 데이터 세트의 주요 특징은 무엇입니까?

Hand Keypoints 데이터 세트는 고급 포즈 추정 작업을 위해 설계되었으며 다음과 같은 주요 기능을 포함합니다.

  • 대규모 데이터셋: 손 키포인트 어노테이션이 있는 26,768장의 이미지를 포함합니다.
  • YOLO11 호환성: YOLO11 모델과 함께 사용할 준비가 되었습니다.
  • 21개의 키포인트: 손목 및 손가락 관절을 포함한 손 자세에 대한 상세한 표현입니다.

자세한 내용은 Hand Keypoints 데이터 세트 섹션을 참조하세요.

손 키포인트 데이터 세트를 사용하면 어떤 애플리케이션이 이점을 얻을 수 있습니까?

손 키포인트 데이터 세트는 다음을 포함한 다양한 분야에서 적용할 수 있습니다.

  • 제스처 인식: 인간-컴퓨터 상호 작용을 향상시킵니다.
  • AR/VR 제어: 증강 현실 및 가상 현실에서 사용자 경험을 개선합니다.
  • 로봇 조작: 로봇 손의 정밀한 제어를 가능하게 합니다.
  • 의료: 의료 진단을 위한 손 움직임 분석.
  • 애니메이션: 현실적인 애니메이션을 위한 모션 캡처.
  • 생체 인식 인증: 보안 시스템 강화.

자세한 내용은 애플리케이션 섹션을 참조하십시오.

Hand Keypoints 데이터 세트는 어떻게 구성되어 있습니까?

손 키포인트 데이터 세트는 두 개의 하위 세트로 나뉩니다.

  1. Train: 포즈 추정 모델 학습을 위한 18,776개의 이미지를 포함합니다.
  2. Val: 모델 훈련 중 검증을 위해 7,992개의 이미지를 포함합니다.

이 구조는 포괄적인 학습 및 검증 프로세스를 보장합니다. 자세한 내용은 데이터 세트 구조 섹션을 참조하세요.

학습에 데이터 세트 YAML 파일을 어떻게 사용합니까?

데이터 세트 구성은 경로, 클래스 및 기타 관련 정보를 포함하는 YAML 파일에 정의되어 있습니다. hand-keypoints.yaml 파일은 다음 위치에서 찾을 수 있습니다. hand-keypoints.yaml.

학습에 이 YAML 파일을 사용하려면 위에 표시된 학습 예제와 같이 학습 스크립트 또는 CLI 명령에서 지정하십시오. 자세한 내용은 데이터 세트 YAML 섹션을 참조하십시오.



📅 11달 전에 생성되었습니다. ✏️ 5달 전에 업데이트되었습니다.

댓글