Перейти к содержанию

Набор данных для обнаружения сигнатур

Этот набор данных предназначен для обнаружения человеческих подписей в документах. Он включает в себя различные типы документов с аннотированными подписями, предоставляя ценные сведения для приложений в области проверки документов и обнаружения мошенничества. Этот набор данных, необходимый для обучения алгоритмов компьютерного зрения, помогает идентифицировать подписи в документах различных форматов, поддерживая исследования и практические приложения в области анализа документов.

Структура набора данных

Набор данных для обнаружения сигнатур разделен на два подмножества:

  • Обучающий набор: Содержит 143 изображения, каждое из которых снабжено соответствующими аннотациями.
  • Валидационный набор: Включает 35 изображений, каждое с парными аннотациями.

Приложения

Этот набор данных может быть использован в различных задачах компьютерного зрения, таких как обнаружение объектов, отслеживание объектов и анализ документов. В частности, он может быть использован для обучения и оценки моделей для идентификации подписей в документах, что имеет значительное применение в:

  • Верификация документов: Автоматизация процесса проверки юридических и финансовых документов
  • Обнаружение мошенничества: Выявление потенциально поддельных или неавторизованных подписей
  • Цифровая обработка документов: Оптимизация рабочих процессов в административном и юридическом секторах
  • Банки и финансы: Повышение безопасности при обработке чеков и проверке кредитных документов
  • Архивные исследования: Поддержка анализа и каталогизации исторических документов

Кроме того, он служит ценным ресурсом для образовательных целей, позволяя студентам и исследователям изучать характеристики подписей в различных типах документов.

Набор данных YAML

Файл YAML (Yet Another Markup Language) определяет конфигурацию набора данных, включая пути и информацию о классах. Для набора данных для обнаружения сигнатур файл signature.yaml файл находится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Использование

Чтобы обучить модель YOLO11n на наборе данных по обнаружению сигнатур в течение 100 эпох при размере изображения 640, используйте предоставленные примеры кода. Полный список доступных параметров см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Пример вывода

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Образцы изображений и аннотаций

Набор данных для обнаружения подписей включает в себя широкий спектр изображений, демонстрирующих различные типы документов и аннотированные подписи. Ниже приведены примеры изображений из набора данных, каждое из которых сопровождается соответствующими аннотациями.

Образец изображения из набора данных для обнаружения сигнатур

  • Мозаичные изображения: Здесь мы представляем обучающую партию, состоящую из мозаичных изображений набора данных. Мозаика - метод обучения, при котором несколько изображений объединяются в одно, что обогащает разнообразие партии. Этот метод помогает повысить способность модели обобщать различные размеры подписей, соотношение сторон и контекст.

Этот пример иллюстрирует разнообразие и сложность изображений в наборе данных для обнаружения подписей, подчеркивая преимущества включения мозаики в процесс обучения.

Цитаты и благодарности

Набор данных был выпущен в соответствии с лицензиейAGPL-3.0 .

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что такое набор данных Signature Detection Dataset и как его можно использовать?

Набор данных Signature Detection Dataset - это коллекция аннотированных изображений, предназначенных для обнаружения человеческих подписей в документах различных типов. Она может применяться в задачах компьютерного зрения, таких как обнаружение и отслеживание объектов, в первую очередь для проверки документов, выявления мошенничества и архивных исследований. Этот набор данных помогает обучить модели распознаванию подписей в различных контекстах, что делает его ценным как для исследований, так и для практического применения в интеллектуальном анализе документов.

Как обучить модель YOLO11n на наборе данных Signature Detection Dataset?

Чтобы обучить модель YOLO11n на наборе данных Signature Detection Dataset, выполните следующие действия:

  1. Скачать signature.yaml файл конфигурации набора данных из signature.yaml.
  2. Чтобы начать обучение, используйте следующий скрипт Python или команду CLI :

Пример поезда

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Более подробную информацию вы найдете на странице Обучение.

Каковы основные области применения набора данных Signature Detection Dataset?

Набор данных Signature Detection Dataset можно использовать для:

  1. Проверка документов: Автоматическая проверка наличия и подлинности человеческих подписей в документах.
  2. Обнаружение мошенничества: Выявление поддельных или мошеннических подписей в юридических и финансовых документах.
  3. Архивные исследования: Помощь историкам и архивистам в цифровом анализе и каталогизации исторических документов.
  4. Образование: Поддержка академических исследований и преподавания в области компьютерного зрения и машинного обучения.
  5. Финансовые услуги: Повышение безопасности банковских операций и оформления кредитов путем проверки подлинности подписи.

Как сделать вывод, используя модель, обученную на наборе данных Signature Detection Dataset?

Чтобы сделать вывод с помощью модели, обученной на наборе данных Signature Detection Dataset, выполните следующие действия:

  1. Загрузите отлаженную модель.
  2. Используйте приведенный ниже скрипт Python или команду CLI для выполнения вывода:

Пример вывода

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Какова структура набора данных Signature Detection Dataset и где можно найти дополнительную информацию?

Набор данных для обнаружения подписей разделен на два подмножества:

  • Набор для обучения: Содержит 143 изображения с аннотациями.
  • Набор для проверки: Включает 35 изображений с аннотациями.

Для получения подробной информации вы можете обратиться к Структура набора данных раздел. Кроме того, просмотрите полную конфигурацию набора данных в разделе signature.yaml файл, расположенный по адресу signature.yaml.

📅 Создано 10 месяцев назад ✏️ Обновлено 8 дней назад

Комментарии