Link to this sectionDog-Pose 데이터셋#
Link to this section소개#
Ultralytics Dog-Pose 데이터셋은 개 키포인트 추정을 위해 특별히 선별된 고품질의 방대한 데이터셋입니다. 6,773개의 학습 이미지와 1,703개의 테스트 이미지로 구성된 이 데이터셋은 강력한 자세 추정 모델을 학습시키기 위한 견고한 기반을 제공합니다.
Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial
각 어노테이션된 이미지에는 키포인트당 3차원(x, y, 가시성)을 포함한 24개의 키포인트가 포함되어 있어, 컴퓨터 비전 분야의 고급 연구 및 개발을 위한 귀중한 자원이 됩니다.
이 데이터셋은 Ultralytics Platform 및 YOLO26과 함께 사용하도록 의도되었습니다.
Link to this section데이터셋 구조#
-
데이터 분할: 6,773개의 학습 이미지 / 1,703개의 검증 이미지 및 대응하는 YOLO 형식의 라벨 파일.
-
Keypoints: 24 per dog with
(x, y, visibility)triplets. -
레이아웃:
datasets/dog-pose/ ├── images/{train,val} └── labels/{train,val}
Link to this section데이터셋 YAML#
데이터셋 구성을 정의하기 위해 YAML(Yet Another Markup Language) 파일이 사용됩니다. 이 파일에는 경로, 키포인트 세부 정보 및 기타 관련 정보가 포함되어 있습니다. Dog-pose 데이터셋의 경우 dog-pose.yaml 파일을 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml에서 확인할 수 있습니다.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zipLink to this section사용법#
Dog-pose 데이터셋에서 YOLO26n-pose 모델을 100 epochs 동안 이미지 크기 640으로 학습시키려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 Training 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Link to this section샘플 이미지 및 주석#
다음은 Dog-pose 데이터셋의 이미지 예시와 해당 어노테이션입니다:
- 모자이크 처리된 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기술입니다. 이는 모델이 다양한 객체 크기, 종횡비 및 맥락에 일반화할 수 있는 능력을 향상시키는 데 도움이 됩니다.
이 예시는 Dog-pose 데이터셋에 포함된 이미지들의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹(mosaicing)을 사용할 때의 이점을 보여줍니다.
Link to this section인용 및 감사의 글#
연구 또는 개발 작업에 Dog-pose 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}We would like to acknowledge the Stanford team for creating and maintaining this valuable resource for the computer vision community. For more information about the Dog-pose dataset and its creators, visit the Stanford Dogs Dataset website.
Link to this sectionFAQ#
Link to this sectionDog-pose 데이터셋이란 무엇이며, Ultralytics YOLO26과 어떻게 사용합니까?#
Dog-Pose 데이터셋은 개 자세 추정을 위해 24개의 키포인트가 어노테이션된 6,773개의 학습 이미지와 1,703개의 테스트 이미지를 제공합니다. 이 데이터셋은 Ultralytics YOLO26을 활용한 모델 학습 및 검증을 위해 설계되었으며, 동물 행동 분석, 반려동물 모니터링, 수의학 연구와 같은 응용 분야를 지원합니다. 포괄적인 어노테이션 덕분에 개를 위한 정확한 자세 추정 모델을 개발하는 데 이상적입니다.
Link to this sectionUltralytics에서 Dog-pose 데이터셋을 사용하여 YOLO26 모델을 어떻게 학습시킵니까?#
Dog-pose 데이터셋에서 YOLO26n-pose 모델을 100 에포크 동안 이미지 크기 640으로 학습시키려면 다음 예시를 따르십시오:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)학습 인수에 대한 전체 목록은 모델 Training 페이지를 참조하십시오.
Link to this sectionDog-pose 데이터셋을 사용할 때의 이점은 무엇입니까?#
Dog-pose 데이터셋은 다음과 같은 몇 가지 이점을 제공합니다:
대규모의 다양한 데이터셋: 8,400개 이상의 이미지를 통해 개의 다양한 자세, 품종, 상황을 포괄하는 방대한 데이터를 제공하여 모델 학습 및 평가의 견고함을 높여줍니다.
상세한 키포인트 어노테이션: 각 이미지에는 키포인트당 3차원(x, y, 가시성)을 포함한 24개의 키포인트가 포함되어 있어, 정확한 자세 탐지 모델 학습을 위한 정밀한 어노테이션을 제공합니다.
실제 환경 시나리오: 다양한 환경의 이미지를 포함하고 있어 반려동물 모니터링 및 행동 분석과 같은 실제 응용 프로그램에 대한 모델의 일반화 능력을 향상시킵니다.
전이 학습의 이점: 이 데이터셋은 전이 학습 기법과 잘 작동하며, 사람 자세 데이터셋으로 사전 학습된 모델을 개 특화 기능에 맞게 조정할 수 있습니다.
특징 및 사용법에 대한 자세한 내용은 데이터셋 소개 섹션을 참조하십시오.
Link to this section모자이킹(mosaicing)은 Dog-pose 데이터셋을 사용하는 YOLO26 학습 과정에 어떤 이점을 줍니까?#
Dog-pose 데이터셋의 샘플 이미지에서 볼 수 있듯이 모자이킹은 여러 이미지를 하나의 복합 이미지로 병합하여 각 학습 배치에서 객체와 장면의 다양성을 풍부하게 합니다. 이 기법은 다음과 같은 이점을 제공합니다:
- 각 배치 내에서 개의 자세, 크기, 배경의 다양성 증가
- 다양한 맥락과 규모에서 개를 탐지하는 모델의 능력 향상
- 모델을 보다 다양한 시각적 패턴에 노출시켜 일반화 능력 강화
- 학습 예제의 새로운 조합을 생성하여 과적합(overfitting) 감소
이 접근 방식은 실제 시나리오에서 더 나은 성능을 보이는 강력한 모델을 생성합니다. 이미지 예시는 샘플 이미지 및 어노테이션 섹션을 참조하십시오.
Link to this sectionDog-pose 데이터셋 YAML 파일은 어디에서 찾을 수 있으며 어떻게 사용합니까?#
Dog-pose 데이터셋 YAML 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml에서 확인할 수 있습니다. 이 파일은 경로, 클래스, 키포인트 세부 정보 및 기타 관련 정보를 포함한 데이터셋 구성을 정의합니다. YAML 파일은 키포인트당 3차원을 갖는 24개의 키포인트를 명시하므로 상세한 자세 추정 작업에 적합합니다.
YOLO26 학습 스크립트와 함께 이 파일을 사용하려면 사용법 섹션에 설명된 대로 학습 명령에서 참조하기만 하면 됩니다. 처음 사용할 때 데이터셋이 자동으로 다운로드되므로 설정이 간편합니다.
더 많은 FAQ와 상세 문서는 Ultralytics 문서를 방문하십시오.