Link to this sectionНабор данных Dog-Pose#
Link to this sectionВведение#
Набор данных Ultralytics Dog-Pose — это высококачественный и обширный набор данных, специально созданный для оценки ключевых точек у собак. Содержащий 6 773 обучающих и 1 703 тестовых изображения, этот набор данных служит надежной основой для обучения устойчивых моделей оценки позы.
Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial
Каждое аннотированное изображение включает 24 ключевые точки с 3 измерениями для каждой (x, y, видимость), что делает его ценным ресурсом для передовых исследований и разработок в области компьютерного зрения.
Этот набор данных предназначен для использования с Ultralytics Platform и YOLO26.
Link to this sectionСтруктура набора данных#
-
Разделение: 6 773 обучающих / 1 703 валидационных изображения с соответствующими файлами меток в формате YOLO.
-
Keypoints: 24 per dog with
(x, y, visibility)triplets. -
Структура:
datasets/dog-pose/ ├── images/{train,val} └── labels/{train,val}
Link to this sectionYAML набора данных#
Для определения конфигурации набора данных используется файл YAML (Yet Another Markup Language). Он включает пути, детали ключевых точек и другую соответствующую информацию. В случае с набором данных Dog-pose файл dog-pose.yaml доступен по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zipLink to this sectionИспользование#
Чтобы обучить модель YOLO26n-pose на наборе данных Dog-pose в течение 100 эпох с размером изображения 640, воспользуйся следующими фрагментами кода. Полный список доступных аргументов см. на странице Обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Link to this sectionПримеры изображений и аннотации#
Ниже приведены несколько примеров изображений из набора данных Dog-pose вместе с соответствующими аннотациями:
- Мозаичное изображение: это изображение демонстрирует обучающий пакет, составленный из мозаично собранных изображений. Мозаика — это техника, используемая во время обучения, которая объединяет несколько изображений в одно, чтобы увеличить разнообразие объектов и сцен в каждом обучающем пакете. Это помогает улучшить способность модели к обобщению при работе с объектами различных размеров, соотношений сторон и контекстов.
Этот пример демонстрирует разнообразие и сложность изображений в наборе данных Dog-pose, а также преимущества использования мозаики в процессе обучения.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных Dog-pose в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}Мы хотим выразить благодарность команде Стэнфорда за создание и поддержку этого ценного ресурса для сообщества компьютерного зрения. Для получения дополнительной информации о наборе данных Dog-pose и его создателях посети сайт набора данных Stanford Dogs.
Link to this sectionFAQ#
Link to this sectionЧто такое набор данных Dog-pose и как он используется с Ultralytics YOLO26?#
Набор данных Dog-Pose содержит 6 773 обучающих и 1 703 тестовых изображения, аннотированных 24 ключевыми точками для оценки позы собак. Он предназначен для обучения и валидации моделей с помощью Ultralytics YOLO26 и поддерживает такие приложения, как анализ поведения животных, мониторинг домашних питомцев и ветеринарные исследования. Обширные аннотации набора данных делают его идеальным для разработки точных моделей оценки позы собак.
Link to this sectionКак обучить модель YOLO26, используя набор данных Dog-pose в Ultralytics?#
Чтобы обучить модель YOLO26n-pose на наборе данных Dog-pose в течение 100 эпох с размером изображения 640, следуй этим примерам:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Полный список аргументов для обучения см. на странице Обучения модели.
Link to this sectionКаковы преимущества использования набора данных Dog-pose?#
Набор данных Dog-pose предлагает несколько преимуществ:
Большой и разнообразный набор данных: С более чем 8 400 изображениями он предоставляет существенный объем данных, охватывающий широкий спектр поз собак, пород и контекстов, что обеспечивает надежное обучение и оценку модели.
Подробные аннотации ключевых точек: Каждое изображение включает 24 ключевые точки с 3 измерениями для каждой (x, y, видимость), предлагая точные аннотации для обучения моделей точного определения позы.
Реальные сценарии: Включает изображения из разнообразных сред, что улучшает способность модели обобщать данные для реальных приложений, таких как мониторинг домашних питомцев и анализ поведения.
Преимущество трансферного обучения: Набор данных хорошо работает с методами трансферного обучения, позволяя моделям, предварительно обученным на наборах данных поз людей, адаптироваться к особенностям собак.
Дополнительную информацию о его функциях и использовании см. в разделе Введение в набор данных.
Link to this sectionКакую пользу приносит мозаика в процессе обучения YOLO26 с использованием набора данных Dog-pose?#
Мозаика, как показано на примерах изображений из набора данных Dog-pose, объединяет несколько изображений в одно составное, обогащая разнообразие объектов и сцен в каждом обучающем батче. Этот метод дает ряд преимуществ:
- Увеличивает разнообразие поз собак, их размеров и фонов в каждом батче
- Улучшает способность модели обнаруживать собак в разных контекстах и масштабах
- Усиливает обобщающую способность за счет представления модели более разнообразных визуальных паттернов
- Снижает переобучение за счет создания новых комбинаций примеров для обучения
Этот подход приводит к созданию более надежных моделей, которые лучше работают в реальных сценариях. Примеры изображений см. в разделе Примеры изображений и аннотаций.
Link to this sectionГде найти YAML-файл набора данных Dog-pose и как его использовать?#
YAML-файл набора данных Dog-pose можно найти по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Этот файл определяет конфигурацию набора данных, включая пути, классы, детали ключевых точек и другую соответствующую информацию. YAML задает 24 ключевые точки с 3 измерениями для каждой, что делает его пригодным для задач детальной оценки позы.
Чтобы использовать этот файл со скриптами обучения YOLO26, просто укажи его в своей команде обучения, как показано в разделе Использование. Набор данных будет автоматически загружен при первом использовании, что делает настройку очень простой.
Больше часто задаваемых вопросов и подробную документацию можно найти в Документации Ultralytics.