콘텐츠로 건너뛰기

개 포즈 데이터 세트

소개

개 포즈 데이터 세트는 Ultralytics 강아지 포즈 데이터 세트는 강아지 키포인트 추정을 위해 특별히 선별된 고품질의 광범위한 데이터 세트입니다. 6,773개의 훈련 이미지와 1,703개의 테스트 이미지가 포함된 이 데이터 세트는 강력한 포즈 추정 모델을 훈련하기 위한 탄탄한 토대를 제공합니다. 각 주석이 달린 이미지에는 키포인트당 3차원(x, y, 가시성)의 24개 키포인트가 포함되어 있어 컴퓨터 비전 분야의 고급 연구 및 개발에 유용한 리소스로 활용할 수 있습니다.

Ultralytics 개 자세 디스플레이 이미지

이 데이터 세트는 Ultralytics HUB 및 YOLO11.

데이터 세트 YAML

데이터 세트 구성을 정의하는 데는 YAML(또 다른 마크업 언어) 파일이 사용됩니다. 여기에는 경로, 키포인트 세부 정보 및 기타 관련 정보가 포함됩니다. 강아지 포즈 데이터 세트의 경우에는 dog-pose.yaml 에서 사용할 수 있습니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

사용법

이미지 크기가 640인 100개의 포즈 데이터 세트에 대해 YOLO11n 포즈 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

샘플 이미지 및 주석

다음은 개 포즈 데이터 세트의 이미지 몇 가지 예와 해당 주석입니다:

데이터 세트 샘플 이미지

  • 모자이크 이미지: 이 이미지는 모자이크된 데이터 세트 이미지로 구성된 훈련 배치의 예시입니다. 모자이크는 여러 이미지를 하나의 이미지로 결합하여 각 훈련 배치 내에서 다양한 개체와 장면을 늘리기 위해 훈련 중에 사용되는 기술입니다. 이를 통해 다양한 객체 크기, 종횡비 및 컨텍스트에 일반화하는 모델의 능력을 향상시킬 수 있습니다.

이 예는 개 포즈 데이터 세트에 포함된 이미지의 다양성과 복잡성, 그리고 훈련 과정에서 모자이킹을 사용할 때의 이점을 보여줍니다.

인용 및 감사

연구 또는 개발 작업에 개 포즈 데이터 세트를 사용하는 경우 다음 논문을 인용해 주세요:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

컴퓨터 비전 커뮤니티를 위해 이 귀중한 리소스를 만들고 유지 관리해 주신 스탠포드 팀에 감사의 말씀을 전합니다. 개 포즈 데이터 세트와 제작자에 대한 자세한 내용은 스탠포드 개 데이터 세트 웹사이트를 방문하세요.

자주 묻는 질문

도그 포즈 데이터 세트는 무엇이며 Ultralytics YOLO11 ?

개 자세 데이터 세트에는 개 자세 추정을 위한 24개의 키포인트로 주석이 달린 6,773개의 훈련 이미지와 1,703개의 테스트 이미지가 포함되어 있습니다. 다음을 사용하여 모델을 훈련하고 검증할 수 있도록 설계되었습니다. Ultralytics YOLO11를 사용하여 모델을 훈련하고 검증하도록 설계되었으며, 동물 행동 분석, 애완동물 모니터링 및 수의학 연구와 같은 애플리케이션을 지원합니다. 이 데이터 세트의 포괄적인 주석은 개를 위한 정확한 자세 추정 모델을 개발하는 데 이상적입니다.

Ultralytics 의 개 자세 데이터 집합을 사용하여 YOLO11 모델을 훈련하려면 어떻게 하나요?

이미지 크기가 640인 100개의 개 포즈 데이터 세트에 대해 YOLO11n-포즈 모델을 훈련하려면 다음 예제를 따르세요:

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

훈련 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.

강아지 포즈 데이터 세트를 사용하면 어떤 이점이 있나요?

개 포즈 데이터 세트는 몇 가지 이점을 제공합니다:

방대하고 다양한 데이터 세트: 8,400개 이상의 이미지로 다양한 반려견의 자세, 품종, 상황을 포괄하는 방대한 데이터를 제공하여 강력한 모델 훈련과 평가를 가능하게 합니다.

상세한 키포인트 주석: 각 이미지에는 키포인트당 3차원(x, y, 가시성)의 24개 키포인트가 포함되어 있어 정확한 포즈 감지 모델을 훈련할 수 있는 정밀한 주석을 제공합니다.

실제 시나리오: 다양한 환경의 이미지를 포함하여 반려동물 모니터링 및 행동 분석과 같은 실제 애플리케이션에 일반화할 수 있는 모델의 기능을 향상시킵니다.

전이 학습의 이점: 이 데이터 세트는 전이 학습 기법과 잘 작동하여 사람의 포즈 데이터 세트에 대해 사전 학습된 모델이 개의 특정 특징에 적응할 수 있습니다.

기능 및 사용법에 대한 자세한 내용은 데이터 세트 소개 섹션을 참조하세요.

모자이크가 개 자세 데이터 세트를 사용하는 YOLO11 훈련 프로세스에 어떤 이점이 있나요?

개 포즈 데이터 세트의 샘플 이미지에서 볼 수 있듯이 모자이싱은 여러 이미지를 하나의 합성물로 병합하여 각 훈련 배치에서 물체와 장면의 다양성을 풍부하게 합니다. 이 기법은 여러 가지 이점을 제공합니다:

  • 각 배치에서 다양한 강아지 포즈, 크기 및 배경을 늘립니다.
  • 다양한 상황과 규모에서 개를 감지하는 모델의 능력을 향상시킵니다.
  • 보다 다양한 시각적 패턴에 모델을 노출하여 일반화 향상
  • 새로운 조합의 훈련 예제를 생성하여 과적합을 줄입니다.

이 접근 방식은 실제 시나리오에서 더 나은 성능을 발휘하는 더 강력한 모델로 이어집니다. 이미지 예시는 샘플 이미지 및 주석 섹션을 참조하세요.

Dog-pose 데이터 세트 YAML 파일은 어디에서 찾을 수 있으며 어떻게 사용하나요?

Dog-pose 데이터세트 YAML 파일은 여기에서 찾을 수 있습니다. 이 파일은 경로, 클래스, 키포인트 세부 정보 및 기타 관련 정보를 포함한 데이터 세트 구성을 정의합니다. 이 YAML은 키포인트당 3차원의 24개 키포인트를 지정하므로 세부적인 포즈 추정 작업에 적합합니다.

이 파일을 YOLO11 트레이닝 스크립트와 함께 사용하려면 사용법 섹션에 표시된 대로 트레이닝 명령에서 해당 파일을 참조하기만 하면 됩니다. 데이터 세트는 처음 사용할 때 자동으로 다운로드되므로 설정이 간단합니다.

더 많은 FAQ와 자세한 설명서를 보려면 Ultralytics 문서를 참조하세요.

4개월 전 생성됨 ✏️ 업데이트됨 8 일 전

댓글