Tiger-Pose 데이터셋

소개

Ultralytics는 포즈 추정 작업을 위해 설계된 다목적 컬렉션인 Tiger-Pose 데이터셋을 소개합니다. 이 데이터셋은 YouTube 영상에서 추출한 263개의 이미지로 구성되어 있으며, 210개의 이미지는 학습용으로, 53개의 이미지는 검증용으로 할당되었습니다. 이는 포즈 추정 알고리즘을 테스트하고 문제 해결을 수행하는 데 탁월한 리소스입니다.

210개의 이미지라는 적절한 학습 데이터 규모에도 불구하고, Tiger-Pose 데이터셋은 다양성을 제공하므로 학습 파이프라인 평가, 잠재적 오류 식별, 그리고 포즈 추정을 위한 더 큰 데이터셋으로 작업하기 전의 유용한 사전 단계로서 적합합니다.

이 데이터셋은 Ultralytics PlatformYOLO26과 함께 사용하도록 의도되었습니다.

데이터셋 구조

  • 전체 이미지 수: 263개 (학습 210개 / 검증 53개).
  • 키포인트: 호랑이당 12개 (가시성 플래그 없음).
  • Directory layout: YOLO-format keypoints stored under labels/{train,val} alongside images/{train,val} directories.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

데이터셋 YAML

YAML (Yet Another Markup Language) 파일은 데이터셋의 구성 세부 정보를 지정하는 수단으로 사용됩니다. 이 파일에는 파일 경로, 클래스 정의 및 기타 관련 정보와 같은 중요한 데이터가 포함됩니다. 특히 tiger-pose.yaml 파일의 경우, Ultralytics Tiger-Pose 데이터셋 구성 파일을 확인하시기 바랍니다.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

사용법

Tiger-Pose 데이터셋에서 100 에포크, 이미지 크기 640으로 YOLO26n-pose 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 전체 인수 목록은 모델 학습 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

샘플 이미지 및 주석

Tiger-Pose 데이터셋에 포함된 이미지와 해당 주석의 몇 가지 예시는 다음과 같습니다:

Tiger pose estimation dataset mosaic training batch
  • 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.

이 예시는 Tiger-Pose 데이터셋에 포함된 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹을 사용할 때의 이점을 보여줍니다.

추론 예제

추론 예제
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

인용 및 감사의 글

이 데이터셋은 AGPL-3.0 License 하에 배포되었습니다.

FAQ

Ultralytics Tiger-Pose 데이터셋은 어떤 용도로 사용되나요?

Ultralytics Tiger-Pose 데이터셋은 포즈 추정 작업을 위해 설계되었으며, YouTube 영상에서 소싱된 263개의 이미지로 구성됩니다. 이 데이터셋은 210개의 학습 이미지와 53개의 검증 이미지로 나뉩니다. 이는 Ultralytics PlatformYOLO26을 사용하여 포즈 추정 알고리즘을 테스트, 학습 및 개선하는 데 특히 유용합니다.

Tiger-Pose 데이터셋에서 YOLO26 모델을 어떻게 학습시키나요?

Tiger-Pose 데이터셋에서 100 에포크, 이미지 크기 640으로 YOLO26n-pose 모델을 학습하려면 다음 코드 스니펫을 사용하십시오. 자세한 내용은 학습 페이지를 방문하십시오:

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

tiger-pose.yaml 파일에는 어떤 구성이 포함되어 있나요?

tiger-pose.yaml 파일은 Tiger-Pose 데이터셋의 구성 세부 정보를 지정하는 데 사용됩니다. 이 파일에는 파일 경로 및 클래스 정의와 같은 중요한 데이터가 포함되어 있습니다. 정확한 구성을 확인하려면 Ultralytics Tiger-Pose 데이터셋 구성 파일을 확인하십시오.

Tiger-Pose 데이터셋으로 학습된 YOLO26 모델을 사용하여 추론을 실행하려면 어떻게 해야 하나요?

Tiger-Pose 데이터셋으로 학습된 YOLO26 모델을 사용하여 추론을 수행하려면 다음 코드 스니펫을 사용할 수 있습니다. 자세한 가이드는 예측 페이지를 방문하십시오:

추론 예제
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

포즈 추정에 Tiger-Pose 데이터셋을 사용하면 어떤 이점이 있나요?

Tiger-Pose 데이터셋은 210개의 학습 이미지라는 관리하기 쉬운 규모임에도 불구하고, 포즈 추정 파이프라인 테스트에 이상적인 다양한 이미지 컬렉션을 제공합니다. 이 데이터셋은 잠재적 오류를 식별하는 데 도움을 주며 더 큰 데이터셋으로 작업하기 전의 사전 단계 역할을 합니다. 또한, 이 데이터셋은 Ultralytics PlatformYOLO26과 같은 고급 도구를 사용하여 포즈 추정 알고리즘의 학습 및 개선을 지원함으로써 모델 성능과 정확도를 향상시킵니다.

댓글