Перейти к содержимому

Набор данных для обнаружения сигнатур

Этот набор данных предназначен для обнаружения человеческих подписей в документах. Он включает в себя различные типы документов с аннотированными подписями, предоставляя ценные сведения для приложений, связанных с проверкой документов и обнаружением мошенничества. Необходимый для обучения алгоритмов компьютерного зрения, этот набор данных помогает идентифицировать подписи в документах различных форматов, поддерживая исследования и практические приложения в области анализа документов.

Структура набора данных

Набор данных для обнаружения сигнатур разбит на три подмножества:

  • Тренировочный набор: Содержит 143 изображения, каждое из которых снабжено соответствующими аннотациями.
  • Валидационный набор: Включает в себя 35 изображений, каждое из которых содержит парные аннотации.

Приложения

Этот набор данных может применяться в различных задачах компьютерного зрения, таких как обнаружение объектов, отслеживание объектов и анализ документов. В частности, его можно использовать для обучения и оценки моделей для идентификации подписей в документах, что может найти применение в проверке документов, обнаружении мошенничества и архивных исследованиях. Кроме того, он может послужить ценным ресурсом для образовательных целей, позволяя студентам и исследователям изучать и понимать характеристики и поведение подписей в различных типах документов.

Набор данных YAML

Файл YAML (Yet Another Markup Language) определяет конфигурацию набора данных, включая пути и информацию о классах. Для набора данных, предназначенного для обнаружения сигнатур, файл signature.yaml Файл находится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Использование

Чтобы обучить модель YOLOv8n на наборе данных по обнаружению сигнатур в течение 100 эпох при размере изображения 640, используй предоставленные примеры кода. Полный список доступных параметров можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Пример умозаключения

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Примеры изображений и аннотаций

Набор данных для обнаружения подписей включает в себя множество изображений, демонстрирующих различные типы документов и аннотированные подписи. Ниже приведены примеры изображений из этого набора, каждое из которых сопровождается соответствующими аннотациями.

Образец изображения из набора данных для обнаружения сигнатур

  • Мозаичные изображения: Здесь мы представляем обучающую партию, состоящую из мозаичных изображений из набора данных. Мозаика - метод обучения, при котором несколько изображений объединяются в одно, что обогащает разнообразие партии. Этот метод помогает повысить способность модели к обобщению для различных размеров подписей, соотношения сторон и контекста.

Этот пример иллюстрирует разнообразие и сложность изображений в наборе данных для обнаружения сигнатур, подчеркивая преимущества включения мозаики в процесс обучения.

Цитаты и благодарности

Набор данных был выпущен в свободный доступ по лицензииAGPL-3.0 .



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Комментарии