Link to this sectionНабор данных для обнаружения подписей#

Name: Набор данных для обнаружения подписей
Creator: Ultralytics
License: https://www.ultralytics.com/license
Keywords: Набор данных для обнаружения подписей, обнаружение подписи, проверка документов, обнаружение мошенничества, обнаружение объектов, компьютерное зрение, YOLO26, Ultralytics, аннотированные подписи, анализ документов

Набор данных Ultralytics Signature Detection — это набор данных для обнаружения объектов, состоящий из 178 изображений документов с аннотациями для одного класса signature, предварительно разделенных на 143 изображения для обучения и 35 для валидации. Набор данных скачивается автоматически (11,3 МБ) при первом запуске обучения, что делает его компактной отправной точкой для приложений компьютерного зрения, таких как верификация документов, обнаружение мошенничества и обработка цифровых документов.

Link to this sectionСтруктура набора данных#

Набор данных содержит 178 изображений различных типов документов с рукописными подписями, разделенных на две подвыборки:

Split	Изображения	Описание
Обучение	143	Размеченные изображения для обучения моделей
Validation	35	Отложенные изображения для оценки

Каждое изображение содержит аннотации в виде ограничивающих рамок для одного класса — signature, а конфигурация не предусматривает отдельной тестовой выборки.

Автоматическая загрузка

Набор данных Signature Detection (11,3 МБ) скачивается автоматически из репозитория Ultralytics на GitHub при первом запуске обучения, поэтому ручная загрузка или подготовка не требуются.

Изучи Signature на платформе Ultralytics, чтобы просмотреть изображения с наложенными аннотациями, увидеть распределение классов и тепловые карты ограничивающих рамок на вкладке Charts, а также клонировать его для обучения собственной модели в облаке.

Link to this sectionПрименение#

Модель, обученная на этом наборе данных, может распознавать и отслеживать подписи в отсканированных документах и видео, обеспечивая:

Верификация документов: Автоматизация проверки подписей в юридических и финансовых документах
Обнаружение мошенничества: выявление потенциально поддельных или неавторизованных подписей
Обработка цифровых документов: оптимизация рабочих процессов в административном и юридическом секторах
Банковское дело и финансы: повышение безопасности при обработке чеков и проверке кредитной документации
Архивные исследования: поддержка анализа и каталогизации исторических документов
Образование и исследования: Изучение характеристик подписей в различных типах документов в рамках курсов по компьютерному зрению

Link to this sectionYAML набора данных#

Файл signature.yaml определяет конфигурацию набора данных — пути к данным, имена классов и другие метаданные. Он поддерживается в репозитории Ultralytics по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Link to this sectionИспользование#

Чтобы обучить модель YOLO26n на наборе данных Signature Detection в течение 100 эпох с размером изображения 640, используй предоставленные примеры кода. Полный список доступных параметров представлен на странице обучения модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

После обучения ты можешь выполнять вывод на документах или видео с использованием дообученной модели. В примере ниже показано выполнение предсказания на тестовом видео с порогом уверенности 0,75:

Пример вывода (Inference)

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Link to this sectionПримеры изображений и аннотации#

Набор данных охватывает множество форматов документов, помогая обученным моделям обобщать данные для контрактов, форм и писем. Ниже представлен обучающий пакет из этого набора данных:

Пример изображения из набора данных для обнаружения подписей

Мозаичное изображение: здесь мы представляем обучающий пакет, состоящий из мозаичных изображений набора данных. Мозаика — это метод обучения, который объединяет несколько изображений в одно, обогащая разнообразие пакета. Этот метод помогает повысить способность модели к обобщению при работе с подписями разных размеров, соотношений сторон и контекстов.

Link to this sectionЦитирование и благодарности#

Набор данных доступен по лицензии AGPL-3.0 License.

Если ты используешь набор данных Signature Detection в своей исследовательской или проектной работе, пожалуйста, укажи соответствующую ссылку:

Цитата

@dataset{Ultralytics_Signature_Detection_Dataset_2024,
    author = {Ultralytics},
    title = {Signature Detection Dataset},
    year = {2024},
    publisher = {Ultralytics},
    url = {https://docs.ultralytics.com/datasets/detect/signature/}
}

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных Signature Detection?#

Набор данных Signature Detection — это коллекция из 178 аннотированных изображений документов для обучения моделей обнаружению рукописных подписей. Он поддерживает верификацию документов, обнаружение мошенничества и архивные исследования, являясь практической базой для создания систем интеллектуального анализа документов с помощью машинного обучения.

Link to this sectionКак скачать набор данных Signature Detection?#

Набор данных скачивается автоматически (11,3 МБ) из ресурсов Ultralytics на GitHub при первом запуске обучения с параметром data="signature.yaml" — ручное скачивание не требуется. Чтобы изучить другие наборы данных, ознакомься с обзором наборов данных для обнаружения.

Link to this sectionСколько изображений и классов содержится в наборе данных Signature Detection?#

Набор данных Signature Detection содержит 143 изображения для обучения и 35 для валидации (всего 178), каждое из которых аннотировано одним классом — signature. Отдельной тестовой выборки нет. Подробности см. в разделе Структура набора данных и конфигурации signature.yaml.

Link to this sectionКак обучить модель YOLO26n на наборе данных для обнаружения подписей?#

Ты можешь обучить модель YOLO26n в течение 100 эпох с размером изображения 640, используя Python или CLI:

Пример обучения

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Для получения дополнительной информации обратись к странице обучения и советам по обучению моделей.

Link to this sectionКак выполнить вывод (инференс) с помощью модели, обученной на наборе данных Signature Detection?#

Загрузи свои дообученные веса и запусти предсказание: