Набор данных по ключевым точкам руки
Введение
Набор данных Hand-keypoints содержит 26 768 изображений рук, аннотированных ключевыми точками, что делает его пригодным для обучения моделей типа Ultralytics YOLO для задач оценки позы. Аннотации были сгенерированы с помощью библиотеки Google MediaPipe, что обеспечивает высокую точность и согласованность, и набор данных совместим с другими Ultralytics YOLO11 форматы.
Смотреть: Оценка ключевых точек руки с помощью Ultralytics YOLO11 | Учебник по оценке позы человеческой руки
Ручные достопримечательности
Ключевые точки
Набор данных включает в себя ключевые точки для определения рук. Ключевые точки аннотированы следующим образом:
- Запястье
- Большой палец (4 балла)
- Указательный палец (4 балла)
- Средний палец (4 балла)
- Безымянный палец (4 балла)
- Мизинец (4 балла)
Каждая рука имеет в общей сложности 21 ключевое очко.
Основные характеристики
- Большой набор данных: 26 768 изображений с аннотациями ключевых точек рук.
- YOLO11 Совместимость: Готов к использованию с моделями YOLO11 .
- 21 ключевая точка: Детальное представление позы руки.
Структура набора данных
Набор данных по ключевым точкам рук разделен на два подмножества:
- Train: Этот поднабор содержит 18 776 изображений из набора данных ключевых точек руки, аннотированных для обучения моделей оценки позы.
- Val: Это подмножество содержит 7992 изображения, которые могут быть использованы для проверки в процессе обучения модели.
Приложения
Точки кисти руки могут использоваться для распознавания жестов, управления AR/VR, манипулирования роботами и анализа движений рук в здравоохранении. Они также могут применяться в анимации для захвата движений и в системах биометрической аутентификации для обеспечения безопасности.
Набор данных YAML
Для определения конфигурации набора данных используется файл YAML (Yet Another Markup Language). Он содержит информацию о путях, классах и другую необходимую информацию о наборе данных. В случае с набором данных Hand Keypoints файл hand-keypoints.yaml
файл хранится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
ultralytics/cfg/datasets/hand-keypoints.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
[0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip
Использование
Для обучения модели YOLO11n-pose на наборе данных Hand Keypoints в течение 100 эпох при размере изображения 640 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.
Пример поезда
Образцы изображений и аннотаций
Набор данных Hand keypoints содержит разнообразный набор изображений человеческих рук, аннотированных ключевыми точками. Ниже приведены примеры изображений из этого набора с соответствующими аннотациями:
- Мозаичное изображение: Это изображение демонстрирует обучающую партию, состоящую из мозаичных изображений набора данных. Мозаика - это техника, используемая в процессе обучения, которая объединяет несколько изображений в одно, чтобы увеличить разнообразие объектов и сцен в каждой обучающей партии. Это помогает улучшить способность модели к обобщению для различных размеров объектов, соотношения сторон и контекста.
Этот пример демонстрирует разнообразие и сложность изображений в наборе данных Hand Keypoints и преимущества использования мозаики в процессе обучения.
Цитаты и благодарности
Если вы используете набор данных Hand-keypoints в своих исследованиях или разработках, пожалуйста, укажите следующие источники:
Мы хотели бы поблагодарить следующие источники за предоставленные изображения, использованные в этом наборе данных:
Изображения были собраны и использованы в соответствии с лицензиями, предоставленными каждой платформой, и распространяются по лицензии Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Мы также хотели бы поблагодарить создателя этого набора данных, Риона Дсилву, за его большой вклад в исследования в области ИИ зрения.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Как обучить модель YOLO11 на наборе данных Hand Keypoints?
Для обучения модели YOLO11 на наборе данных Hand Keypoints можно использовать либо Python , либо интерфейс командной строки (CLI). Вот пример обучения модели YOLO11n-pose в течение 100 эпох при размере изображения 640:
Пример
Полный список доступных аргументов см. на странице обучения модели.
Каковы ключевые особенности набора данных Hand Keypoints?
Набор данных Hand Keypoints предназначен для решения сложных задач по оценке позы и включает в себя несколько ключевых особенностей:
- Большой набор данных: Содержит 26 768 изображений с аннотациями ключевых точек руки.
- YOLO11 Совместимость: Готов к использованию с моделями YOLO11 .
- 21 ключевая точка: Детальное представление позы руки, включая суставы запястья и пальцев.
Для получения более подробной информации вы можете изучить раздел Hand Keypoints Dataset.
Какие приложения могут получить выгоду от использования набора данных Hand Keypoints?
Набор данных Hand Keypoints может применяться в различных областях, в том числе:
- Распознавание жестов: Улучшение взаимодействия человека и компьютера.
- AR/VR Controls: Улучшение пользовательского опыта в дополненной и виртуальной реальности.
- Манипулирование роботами: Обеспечение точного управления роботизированными руками.
- Здравоохранение: Анализ движений рук для медицинской диагностики.
- Анимация: Захват движения для создания реалистичной анимации.
- Биометрическая аутентификация: Усовершенствование систем безопасности.
Дополнительную информацию см. в разделе "Приложения".
Как структурирован набор данных Hand Keypoints?
Набор данных Hand Keypoints разделен на два подмножества:
- Поезд: Содержит 18 776 изображений для обучения моделей оценки позы.
- Val: Содержит 7 992 изображения для проверки в процессе обучения модели.
Такая структура обеспечивает всесторонний процесс обучения и проверки. Более подробную информацию см. в разделе "Структура набора данных".
Как использовать YAML-файл набора данных для обучения?
Конфигурация набора данных задается в файле YAML, который содержит пути, классы и другую необходимую информацию. Файл hand-keypoints.yaml
файл можно найти по адресу hand-keypoints.yaml.
Чтобы использовать этот YAML-файл для обучения, укажите его в сценарии обучения или в команде CLI , как показано в примере обучения выше. Более подробную информацию см. в разделе Dataset YAML.