Перейти к содержимому

Набор данных для обнаружения сигнатур

This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.

Структура набора данных

Набор данных для обнаружения сигнатур разбит на три подмножества:

  • Тренировочный набор: Содержит 143 изображения, каждое из которых снабжено соответствующими аннотациями.
  • Валидационный набор: Включает в себя 35 изображений, каждое из которых содержит парные аннотации.

Приложения

Этот набор данных может применяться в различных задачах компьютерного зрения, таких как обнаружение объектов, отслеживание объектов и анализ документов. В частности, его можно использовать для обучения и оценки моделей для идентификации подписей в документах, что может найти применение в проверке документов, обнаружении мошенничества и архивных исследованиях. Кроме того, он может послужить ценным ресурсом для образовательных целей, позволяя студентам и исследователям изучать и понимать характеристики и поведение подписей в различных типах документов.

Набор данных YAML

Файл YAML (Yet Another Markup Language) определяет конфигурацию набора данных, включая пути и информацию о классах. Для набора данных, предназначенного для обнаружения сигнатур, файл signature.yaml Файл находится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Использование

To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Пример умозаключения

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Примеры изображений и аннотаций

Набор данных для обнаружения подписей включает в себя множество изображений, демонстрирующих различные типы документов и аннотированные подписи. Ниже приведены примеры изображений из этого набора, каждое из которых сопровождается соответствующими аннотациями.

Образец изображения из набора данных для обнаружения сигнатур

  • Мозаичные изображения: Здесь мы представляем обучающую партию, состоящую из мозаичных изображений из набора данных. Мозаика - метод обучения, при котором несколько изображений объединяются в одно, что обогащает разнообразие партии. Этот метод помогает повысить способность модели к обобщению для различных размеров подписей, соотношения сторон и контекста.

Этот пример иллюстрирует разнообразие и сложность изображений в наборе данных для обнаружения сигнатур, подчеркивая преимущества включения мозаики в процесс обучения.

Цитаты и благодарности

Набор данных был выпущен в свободный доступ по лицензииAGPL-3.0 .

ВОПРОСЫ И ОТВЕТЫ

Что такое набор данных Signature Detection Dataset и как его можно использовать?

The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.

How do I train a YOLO11n model on the Signature Detection Dataset?

To train a YOLO11n model on the Signature Detection Dataset, follow these steps:

  1. Скачать signature.yaml файл конфигурации набора данных из signature.yaml.
  2. Используй следующий скрипт Python или команду CLI , чтобы начать тренировку:

Пример поезда

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Более подробную информацию ты найдешь на странице " Обучение ".

Каковы основные области применения набора данных Signature Detection Dataset?

Набор данных Signature Detection Dataset можно использовать для:

  1. Верификация документов: Автоматически проверяет наличие и подлинность человеческих подписей в документах.
  2. Обнаружение мошенничества: Выявление поддельных или мошеннических подписей в юридических и финансовых документах.
  3. Архивные исследования: Помощь историкам и архивистам в цифровом анализе и каталогизации исторических документов.
  4. Education: Supporting academic research and teaching in the fields of computer vision and machine learning.

Как я могу сделать вывод, используя модель, обученную на наборе данных Signature Detection Dataset?

Чтобы сделать вывод, используя модель, обученную на наборе данных Signature Detection Dataset, выполни следующие шаги:

  1. Загрузи свою отточенную модель.
  2. Используй приведенный ниже скрипт Python или команду CLI , чтобы сделать вывод:

Пример умозаключения

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Какова структура набора данных Signature Detection Dataset и где я могу найти дополнительную информацию?

Набор данных Signature Detection Dataset разделен на два подмножества:

  • Тренировочный набор: Содержит 143 изображения с аннотациями.
  • Набор для проверки: Включает в себя 35 изображений с аннотациями.

Для получения подробной информации ты можешь обратиться к Структура набора данных раздел. Кроме того, просмотри полную конфигурацию набора данных в разделе signature.yaml файл, расположенный по адресу signature.yaml.

📅 Created 5 months ago ✏️ Updated 1 month ago

Комментарии