손 키포인트 데이터 세트

Q: What are the key features of the Hand Keypoints dataset?

손 키포인트 데이터 세트는 고급 포즈 추정 작업을 위해 설계되었으며 몇 가지 주요 기능을 포함하고 있습니다: 자세한 내용은 손 키포인트 데이터세트 섹션에서 확인할 수 있습니다.

Q: What applications can benefit from using the Hand Keypoints dataset?

손 키포인트 데이터 세트는 다음과 같은 다양한 분야에 적용할 수 있습니다: 자세한 내용은 애플리케이션 섹션을 참조하세요.

Q: How is the Hand Keypoints dataset structured?

손 키포인트 데이터 세트는 두 개의 하위 집합으로 나뉩니다: 이 구조는 포괄적인 훈련 및 검증 프로세스를 보장합니다. 자세한 내용은 데이터 세트 구조 섹션을 참조하세요.

Q: How do I use the dataset YAML file for training?

데이터 세트 구성은 경로, 클래스 및 기타 관련 정보를 포함하는 YAML 파일에 정의되어 있습니다. hand-keypoints.yaml 파일은 hand-keypoints.yaml에서 찾을 수 있습니다. 이 YAML 파일을 트레이닝에 사용하려면 위의 트레이닝 예시와 같이 트레이닝 스크립트 또는 CLI 명령에 지정하세요. 자세한 내용은 데이터 세트 YAML 섹션을 참조하세요.

소개

손 키포인트 데이터 세트에는 키포인트로 주석이 달린 26,768개의 손 이미지가 포함되어 있어, 포즈 추정 작업을 위한 Ultralytics YOLO 같은 모델 훈련에 적합합니다. 주석은 Google MediaPipe 라이브러리를 사용하여 생성되어 높은 정확도와 일관성을 보장하며, 데이터 세트는 다음과 호환됩니다. Ultralytics YOLO11 형식과 호환됩니다.

Watch: Ultralytics YOLO11 | 사람의 손 포즈 추정 튜토리얼을 통한 손 키포인트 추정

핸드 랜드마크

키포인트

데이터 세트에는 손 감지를 위한 키포인트가 포함되어 있습니다. 키포인트에는 다음과 같이 주석을 달았습니다:

손목
엄지 손가락(4점)
검지(4점)
가운데 손가락(4점)
약지(4포인트)
새끼 손가락(4점)

각 손에는 총 21개의 키포인트가 있습니다.

주요 기능

대규모 데이터 세트: 26,768개의 이미지와 손 키포인트 주석.
YOLO11 호환성: YOLO11 모델과 함께 사용 가능.
21개의 키포인트: 상세한 손 포즈 표현.

데이터 세트 구조

손 키포인트 데이터 세트는 두 개의 하위 집합으로 나뉩니다:

Train: 이 하위 집합에는 손 키포인트 데이터 세트의 18,776개 이미지가 포함되어 있으며, 포즈 추정 모델 학습을 위해 주석이 추가되어 있습니다.
Val: 이 하위 집합에는 모델 학습 중 유효성 검사 목적으로 사용할 수 있는 7,992개의 이미지가 포함되어 있습니다.

애플리케이션

손 키포인트는 제스처 인식, AR/VR 제어, 로봇 조작, 헬스케어 분야의 손 움직임 분석에 사용할 수 있습니다. 또한 모션 캡처를 위한 애니메이션과 보안을 위한 생체 인증 시스템에도 적용할 수 있습니다. 손가락 위치를 세밀하게 추적하여 가상 객체와 터치리스 제어 인터페이스를 정밀하게 상호 작용할 수 있습니다.

데이터 세트 YAML

데이터 세트 구성을 정의하는 데는 YAML(또 다른 마크업 언어) 파일이 사용됩니다. 여기에는 데이터 세트의 경로, 클래스 및 기타 관련 정보에 대한 정보가 포함되어 있습니다. 손 키포인트 데이터 세트의 경우, 데이터 세트의 hand-keypoints.yaml 파일은 다음 위치에서 유지됩니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/데이터세트/손 키포인트.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints  ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
  [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

사용법

이미지 크기가 640인 100개의 에포크에 대해 손 키포인트 데이터 세트에서 YOLO11n 포즈 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.

열차 예시

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

샘플 이미지 및 주석

손 키포인트 데이터 세트에는 키포인트로 주석을 단 사람의 손이 있는 다양한 이미지 세트가 포함되어 있습니다. 다음은 해당 주석과 함께 데이터 세트의 이미지 몇 가지 예시입니다:

데이터 세트 샘플 이미지

모자이크 이미지: 이 이미지는 모자이크된 데이터 세트 이미지로 구성된 훈련 배치의 예시입니다. 모자이크는 여러 이미지를 하나의 이미지로 결합하여 각 훈련 배치 내에서 다양한 개체와 장면을 늘리기 위해 훈련 중에 사용되는 기술입니다. 이를 통해 다양한 객체 크기, 종횡비 및 컨텍스트에 일반화하는 모델의 능력을 향상시킬 수 있습니다.

이 예는 핸드 키포인트 데이터 세트에 포함된 이미지의 다양성과 복잡성, 그리고 훈련 과정에서 모자이크 사용의 이점을 보여줍니다.

인용 및 감사

연구 또는 개발 작업에 핸드키포인트 데이터세트를 사용하는 경우 다음 출처를 인정해 주세요:

크레딧

이 데이터 세트에 사용된 이미지를 제공해 주신 다음 출처에 감사드립니다:

이미지는 각 플랫폼에서 제공하는 각 라이선스에 따라 수집 및 사용되었으며, 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 4.0 국제 라이선스에 따라 배포됩니다.

또한, 이 데이터 세트의 제작자인 리온 드실바에게 비전 AI 연구에 큰 기여를 해주신 것에 대해 감사의 말씀을 드립니다.

자주 묻는 질문