Link to this sectionDog-Pose 데이터셋#

Link to this section소개#

Ultralytics Dog-Pose 데이터셋은 개 키포인트 추정을 위해 특별히 선별된 고품질의 방대한 데이터셋으로, 6,773개의 학습 이미지와 1,703개의 검증 이미지를 제공합니다.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

각 어노테이션된 이미지에는 키포인트당 3차원(x, y, 가시성)을 포함한 24개의 키포인트가 포함되어 있어, 컴퓨터 비전 분야의 고급 연구 및 개발을 위한 귀중한 자원이 됩니다.

특정 품종이나 완전히 다른 동물의 경우, Ultralytics Platform을 사용하면 인프라를 직접 관리할 필요 없이 데이터를 업로드하고 레이블을 지정하며 자체 데이터를 사용하여 커스텀 키포인트 모델을 학습할 수 있습니다.

Link to this section데이터셋 구조#

총 이미지 수: 8,476개(학습 6,773개 / 검증 1,703개)이며 YOLO 형식의 레이블 파일이 포함되어 있습니다.
키포인트: 개 한 마리당 24개, (x, y, visibility) 세트 사용.
다운로드 크기: 약 337 MB.

레이아웃:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this section데이터셋 YAML#

YAML 파일은 데이터셋 구성을 정의하는 데 사용됩니다. 여기에는 경로, 키포인트 세부 정보 및 기타 관련 정보가 포함되어 있습니다. Dog-Pose 데이터셋의 경우, dog-pose.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml에서 확인할 수 있습니다.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this section사용법#

Dog-Pose 데이터셋에서 YOLO26n-pose 모델을 640 이미지 크기로 100 epochs 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 자세한 목록은 모델 Training 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this section샘플 이미지 및 주석#

다음은 Dog-Pose 데이터셋의 이미지 예시와 해당 주석입니다:

Dog pose estimation dataset mosaic training batch

모자이크 처리된 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기술입니다. 이는 모델이 다양한 객체 크기, 종횡비 및 맥락에 일반화할 수 있는 능력을 향상시키는 데 도움이 됩니다.

이 예시는 Dog-Pose 데이터셋에 포함된 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹을 사용할 때의 이점을 보여줍니다.

Link to this section인용 및 감사의 글#

연구 또는 개발 작업에 Dog-Pose 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:

인용

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

computer vision 커뮤니티를 위해 이 귀중한 리소스를 만들고 유지 관리해 준 Stanford 팀에 감사드립니다. Dog-Pose 데이터셋과 제작자에 대한 자세한 내용은 Stanford Dogs Dataset 웹사이트를 방문하십시오.

Link to this sectionFAQ#

Link to this sectionDog-Pose 데이터셋이란 무엇이며, Ultralytics YOLO26과 어떻게 사용됩니까?#

Dog-Pose 데이터셋은 개 포즈 추정을 위해 24개의 키포인트가 주석으로 달린 6,773개의 학습 이미지와 1,703개의 검증 이미지를 제공합니다. 이 데이터셋은 Ultralytics YOLO26을 사용하여 모델을 학습 및 검증하도록 설계되었으며, 동물 행동 분석, 반려동물 모니터링, 수의학 연구와 같은 애플리케이션을 지원합니다. 데이터셋의 포괄적인 주석은 개를 위한 정확한 포즈 추정 모델을 개발하는 데 이상적입니다.

Link to this sectionUltralytics에서 Dog-Pose 데이터셋을 사용하여 YOLO26 모델을 어떻게 학습합니까?#

yolo26n-pose.pt를 로드하고 model.train(data="dog-pose.yaml", epochs=100, imgsz=640)을 호출하십시오. 전체 Python 및 CLI 스니펫은 위의 Train Example을 참조하고, 인수의 전체 목록은 모델 Training 페이지를 확인하십시오.

Link to this sectionDog-Pose 데이터셋 사용의 이점은 무엇입니까?#

총 8,476개의 이미지(학습 6,773개 / 검증 1,703개)가 다양한 견종과 포즈를 다루며, 주석당 3차원(x, y, 가시성)으로 구성된 24개의 키포인트를 제공하는 Dog-Pose 데이터셋은 pet monitoring 및 행동 분석과 같은 애플리케이션에 필요한 실제 시나리오 커버리지를 모델에 제공합니다. 기능 및 사용법에 대한 자세한 내용은 Dataset Introduction 섹션을 참조하십시오.

Link to this section모자이킹은 Dog-Pose 데이터셋을 사용한 YOLO26 학습 과정에 어떤 이점을 줍니까?#

모자이킹은 여러 Dog-Pose 이미지를 단일 학습 이미지로 결합하여 모델이 단계별로 보는 개 포즈, 크기 및 배경의 다양성을 높여줍니다. 이는 새로운 컨텍스트와 규모에 대한 일반화 성능을 향상시키고 과적합을 줄여줍니다. 이미지 예시는 Sample Images and Annotations 섹션을 참조하십시오.

Link to this sectionDog-Pose 데이터셋 YAML 파일은 어디에서 찾을 수 있으며 어떻게 사용합니까?#

Dog-Pose 데이터셋 YAML 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml에서 찾을 수 있습니다. 이 파일은 경로, 클래스, 키포인트 세부 정보 및 기타 관련 정보를 포함한 데이터셋 구성을 정의합니다. YAML은 키포인트당 3차원을 가진 24개의 키포인트를 지정하여 상세한 포즈 추정 작업에 적합합니다.

YOLO26 학습 스크립트와 함께 이 파일을 사용하려면 사용법 섹션에 설명된 대로 학습 명령에서 참조하기만 하면 됩니다. 처음 사용할 때 데이터셋이 자동으로 다운로드되므로 설정이 간편합니다.

키포인트 모델에 대한 자세한 내용은 포즈 추정 작업 문서를 참조하십시오.

기여자

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

생성됨 2024년 11월 16일업데이트됨 그저께