Набор данных для распознавания подписей

Этот набор данных предназначен для распознавания рукописных подписей человека в документах. Он включает в себя различные типы документов с аннотированными подписями, что дает ценные возможности для применения в сферах проверки подлинности документов и обнаружения мошенничества. Этот набор данных незаменим для обучения алгоритмов computer vision и помогает находить подписи в различных форматах документов, поддерживая как научные исследования, так и практические задачи анализа документов.

Структура набора данных

Набор данных для распознавания подписей разделен на две подвыборки:

  • Обучающий набор: Содержит 143 изображения, каждое с соответствующими аннотациями.
  • Валидационный набор: Включает 35 изображений, каждое с соответствующими аннотациями.

Приложения

Этот набор данных можно использовать в различных задачах компьютерного зрения, таких как object detection, object tracking и анализ документов. В частности, он подходит для обучения и оценки моделей, предназначенных для поиска подписей в документах, что находит широкое применение в таких областях:

  • Проверка документов: Автоматизация процесса верификации юридических и финансовых документов
  • Обнаружение мошенничества: Выявление потенциально поддельных или неавторизованных подписей
  • Обработка цифровых документов: Оптимизация рабочих процессов в административном и юридическом секторах
  • Банковское дело и финансы: Повышение безопасности при обработке чеков и проверке документов по кредитам
  • Архивные исследования: Поддержка анализа и каталогизации исторических документов

Кроме того, он служит ценным ресурсом для образовательных целей, позволяя студентам и исследователям изучать характеристики подписей на различных типах документов.

YAML набора данных

Файл YAML (Yet Another Markup Language) определяет конфигурацию набора данных, включая пути и информацию о классах. Для набора данных для распознавания подписей файл signature.yaml находится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Использование

Чтобы обучить модель YOLO26n на этом наборе данных в течение 100 epochs с размером изображения 640, воспользуйся приведенными примерами кода. Полный список доступных параметров можно найти на странице Training модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
Пример логического вывода
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Примеры изображений и аннотаций

Набор данных для распознавания подписей включает широкий спектр изображений, демонстрирующих различные типы документов и аннотированные подписи. Ниже приведены примеры изображений из этого набора, каждое из которых сопровождается соответствующими аннотациями.

Пример изображения из набора данных для распознавания подписей

  • Мозаичное изображение: Здесь представлен обучающий пакет, состоящий из мозаично объединенных изображений набора данных. Мозаика — это метод обучения, который объединяет несколько изображений в одно, обогащая разнообразие пакета. Этот метод помогает улучшить способность модели обобщать данные при различных размерах подписей, соотношениях сторон и контекстах.

Этот пример иллюстрирует разнообразие и сложность изображений в наборе данных для распознавания подписей, подчеркивая преимущества использования мозаики в процессе обучения.

Цитирование и благодарности

Набор данных выпущен под лицензией AGPL-3.0 License.

Часто задаваемые вопросы (FAQ)

Что такое набор данных для распознавания подписей и как его можно использовать?

Набор данных для распознавания подписей — это коллекция аннотированных изображений, предназначенная для обнаружения рукописных подписей человека в различных документах. Его можно использовать в задачах компьютерного зрения, таких как object detection и трекинг, в основном для проверки документов, обнаружения мошенничества и архивных исследований. Этот набор помогает обучать модели распознавать подписи в различных контекстах, что делает его ценным как для научных исследований, так и для практических приложений в smart document analysis.

Как обучить модель YOLO26n на наборе данных для распознавания подписей?

Чтобы обучить модель YOLO26n на этом наборе данных, выполни следующие шаги:

  1. Скачай файл конфигурации набора данных signature.yaml по ссылке signature.yaml.
  2. Используй следующий Python-скрипт или CLI-команду для запуска обучения:
Пример обучения
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Для получения дополнительной информации обратись к странице Training.

Каковы основные области применения набора данных для распознавания подписей?

Набор данных для распознавания подписей можно использовать для:

  1. Проверка документов: Автоматическая проверка наличия и подлинности рукописных подписей в документах.
  2. Обнаружение мошенничества: Выявление поддельных или мошеннических подписей в юридических и финансовых документах.
  3. Архивные исследования: Помощь историкам и архивариусам в цифровом анализе и каталогизации исторических документов.
  4. Образование: Поддержка академических исследований и преподавания в области компьютерного зрения и machine learning.
  5. Финансовые услуги: Повышение безопасности банковских транзакций и обработки кредитов путем проверки подлинности подписей.

Как выполнить инференс с использованием модели, обученной на наборе данных для распознавания подписей?

Чтобы выполнить инференс с помощью модели, обученной на этом наборе данных, выполни следующие шаги:

  1. Загрузи свою дообученную модель.
  2. Используй приведенный ниже Python-скрипт или CLI-команду для выполнения инференса:
Пример логического вывода
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Какова структура набора данных для распознавания подписей и где найти больше информации?

Набор данных для распознавания подписей разделен на две подвыборки:

  • Обучающий набор: Содержит 143 изображения с аннотациями.
  • Валидационный набор: Включает 35 изображений с аннотациями.

Для получения подробной информации обратись к разделу Dataset Structure. Кроме того, ознакомься с полной конфигурацией набора данных в файле signature.yaml, который находится по ссылке signature.yaml.

Комментарии