Перейти к содержанию

Набор данных по ключевым точкам руки

Введение

Набор данных Hand-keypoints содержит 26 768 изображений рук, аннотированных ключевыми точками, что делает его пригодным для обучения моделей типа Ultralytics YOLO для задач оценки позы. Аннотации были сгенерированы с помощью библиотеки Google MediaPipe, что обеспечивает высокую точность и согласованность, и набор данных совместим с другими Ultralytics YOLO11 форматы.



Смотреть: Оценка ключевых точек руки с помощью Ultralytics YOLO11 | Учебник по оценке позы человеческой руки

Ручные достопримечательности

Ручные достопримечательности

Ключевые точки

Набор данных включает в себя ключевые точки для определения рук. Ключевые точки аннотированы следующим образом:

  1. Запястье
  2. Большой палец (4 балла)
  3. Указательный палец (4 балла)
  4. Средний палец (4 балла)
  5. Безымянный палец (4 балла)
  6. Мизинец (4 балла)

Каждая рука имеет в общей сложности 21 ключевое очко.

Основные характеристики

  • Большой набор данных: 26 768 изображений с аннотациями ключевых точек рук.
  • YOLO11 Совместимость: Готов к использованию с моделями YOLO11 .
  • 21 ключевая точка: Детальное представление позы руки.

Структура набора данных

Набор данных по ключевым точкам рук разделен на два подмножества:

  1. Train: Этот поднабор содержит 18 776 изображений из набора данных ключевых точек руки, аннотированных для обучения моделей оценки позы.
  2. Val: Это подмножество содержит 7992 изображения, которые могут быть использованы для проверки в процессе обучения модели.

Приложения

Точки кисти руки могут использоваться для распознавания жестов, управления AR/VR, манипулирования роботами и анализа движений рук в здравоохранении. Они также могут применяться в анимации для захвата движений и в системах биометрической аутентификации для обеспечения безопасности.

Набор данных YAML

Для определения конфигурации набора данных используется файл YAML (Yet Another Markup Language). Он содержит информацию о путях, классах и другую необходимую информацию о наборе данных. В случае с набором данных Hand Keypoints файл hand-keypoints.yaml файл хранится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/datasets/hand-keypoints.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints  ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
  [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

Использование

Для обучения модели YOLO11n-pose на наборе данных Hand Keypoints в течение 100 эпох при размере изображения 640 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Образцы изображений и аннотаций

Набор данных Hand keypoints содержит разнообразный набор изображений человеческих рук, аннотированных ключевыми точками. Ниже приведены примеры изображений из этого набора с соответствующими аннотациями:

Образец изображения из набора данных

  • Мозаичное изображение: Это изображение демонстрирует обучающую партию, состоящую из мозаичных изображений набора данных. Мозаика - это техника, используемая в процессе обучения, которая объединяет несколько изображений в одно, чтобы увеличить разнообразие объектов и сцен в каждой обучающей партии. Это помогает улучшить способность модели к обобщению для различных размеров объектов, соотношения сторон и контекста.

Этот пример демонстрирует разнообразие и сложность изображений в наборе данных Hand Keypoints и преимущества использования мозаики в процессе обучения.

Цитаты и благодарности

Если вы используете набор данных Hand-keypoints в своих исследованиях или разработках, пожалуйста, укажите следующие источники:

Мы хотели бы поблагодарить следующие источники за предоставленные изображения, использованные в этом наборе данных:

Изображения были собраны и использованы в соответствии с лицензиями, предоставленными каждой платформой, и распространяются по лицензии Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Мы также хотели бы поблагодарить создателя этого набора данных, Риона Дсилву, за его большой вклад в исследования в области ИИ зрения.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Как обучить модель YOLO11 на наборе данных Hand Keypoints?

Для обучения модели YOLO11 на наборе данных Hand Keypoints можно использовать либо Python , либо интерфейс командной строки (CLI). Вот пример обучения модели YOLO11n-pose в течение 100 эпох при размере изображения 640:

Пример

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Полный список доступных аргументов см. на странице обучения модели.

Каковы ключевые особенности набора данных Hand Keypoints?

Набор данных Hand Keypoints предназначен для решения сложных задач по оценке позы и включает в себя несколько ключевых особенностей:

  • Большой набор данных: Содержит 26 768 изображений с аннотациями ключевых точек руки.
  • YOLO11 Совместимость: Готов к использованию с моделями YOLO11 .
  • 21 ключевая точка: Детальное представление позы руки, включая суставы запястья и пальцев.

Для получения более подробной информации вы можете изучить раздел Hand Keypoints Dataset.

Какие приложения могут получить выгоду от использования набора данных Hand Keypoints?

Набор данных Hand Keypoints может применяться в различных областях, в том числе:

  • Распознавание жестов: Улучшение взаимодействия человека и компьютера.
  • AR/VR Controls: Улучшение пользовательского опыта в дополненной и виртуальной реальности.
  • Манипулирование роботами: Обеспечение точного управления роботизированными руками.
  • Здравоохранение: Анализ движений рук для медицинской диагностики.
  • Анимация: Захват движения для создания реалистичной анимации.
  • Биометрическая аутентификация: Усовершенствование систем безопасности.

Дополнительную информацию см. в разделе "Приложения".

Как структурирован набор данных Hand Keypoints?

Набор данных Hand Keypoints разделен на два подмножества:

  1. Поезд: Содержит 18 776 изображений для обучения моделей оценки позы.
  2. Val: Содержит 7 992 изображения для проверки в процессе обучения модели.

Такая структура обеспечивает всесторонний процесс обучения и проверки. Более подробную информацию см. в разделе "Структура набора данных".

Как использовать YAML-файл набора данных для обучения?

Конфигурация набора данных задается в файле YAML, который содержит пути, классы и другую необходимую информацию. Файл hand-keypoints.yaml файл можно найти по адресу hand-keypoints.yaml.

Чтобы использовать этот YAML-файл для обучения, укажите его в сценарии обучения или в команде CLI , как показано в примере обучения выше. Более подробную информацию см. в разделе Dataset YAML.

📅 Created 2 months ago ✏️ Updated 18 days ago

Комментарии