Набор данных для обнаружения сигнатур
Этот набор данных предназначен для обнаружения человеческих подписей в документах. Он включает в себя различные типы документов с аннотированными подписями, предоставляя ценные сведения для приложений в области проверки документов и обнаружения мошенничества. Этот набор данных, необходимый для обучения алгоритмов компьютерного зрения, помогает идентифицировать подписи в документах различных форматов, поддерживая исследования и практические приложения в области анализа документов.
Структура набора данных
Набор данных для обнаружения сигнатур разделен на два подмножества:
- Обучающий набор: Содержит 143 изображения, каждое из которых снабжено соответствующими аннотациями.
- Валидационный набор: Включает 35 изображений, каждое с парными аннотациями.
Приложения
Этот набор данных может быть использован в различных задачах компьютерного зрения, таких как обнаружение объектов, отслеживание объектов и анализ документов. В частности, он может быть использован для обучения и оценки моделей для идентификации подписей в документах, что имеет значительное применение в:
- Верификация документов: Автоматизация процесса проверки юридических и финансовых документов
- Обнаружение мошенничества: Выявление потенциально поддельных или неавторизованных подписей
- Цифровая обработка документов: Оптимизация рабочих процессов в административном и юридическом секторах
- Банки и финансы: Повышение безопасности при обработке чеков и проверке кредитных документов
- Архивные исследования: Поддержка анализа и каталогизации исторических документов
Кроме того, он служит ценным ресурсом для образовательных целей, позволяя студентам и исследователям изучать характеристики подписей в различных типах документов.
Набор данных YAML
Файл YAML (Yet Another Markup Language) определяет конфигурацию набора данных, включая пути и информацию о классах. Для набора данных для обнаружения сигнатур файл signature.yaml
файл находится по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
Использование
Чтобы обучить модель YOLO11n на наборе данных по обнаружению сигнатур в течение 100 эпох при размере изображения 640, используйте предоставленные примеры кода. Полный список доступных параметров см. на странице обучения модели.
Пример поезда
Пример вывода
Образцы изображений и аннотаций
Набор данных для обнаружения подписей включает в себя широкий спектр изображений, демонстрирующих различные типы документов и аннотированные подписи. Ниже приведены примеры изображений из набора данных, каждое из которых сопровождается соответствующими аннотациями.
- Мозаичные изображения: Здесь мы представляем обучающую партию, состоящую из мозаичных изображений набора данных. Мозаика - метод обучения, при котором несколько изображений объединяются в одно, что обогащает разнообразие партии. Этот метод помогает повысить способность модели обобщать различные размеры подписей, соотношение сторон и контекст.
Этот пример иллюстрирует разнообразие и сложность изображений в наборе данных для обнаружения подписей, подчеркивая преимущества включения мозаики в процесс обучения.
Цитаты и благодарности
Набор данных был выпущен в соответствии с лицензиейAGPL-3.0 .
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Что такое набор данных Signature Detection Dataset и как его можно использовать?
Набор данных Signature Detection Dataset - это коллекция аннотированных изображений, предназначенных для обнаружения человеческих подписей в документах различных типов. Она может применяться в задачах компьютерного зрения, таких как обнаружение и отслеживание объектов, в первую очередь для проверки документов, выявления мошенничества и архивных исследований. Этот набор данных помогает обучить модели распознаванию подписей в различных контекстах, что делает его ценным как для исследований, так и для практического применения в интеллектуальном анализе документов.
Как обучить модель YOLO11n на наборе данных Signature Detection Dataset?
Чтобы обучить модель YOLO11n на наборе данных Signature Detection Dataset, выполните следующие действия:
- Скачать
signature.yaml
файл конфигурации набора данных из signature.yaml. - Чтобы начать обучение, используйте следующий скрипт Python или команду CLI :
Пример поезда
Более подробную информацию вы найдете на странице Обучение.
Каковы основные области применения набора данных Signature Detection Dataset?
Набор данных Signature Detection Dataset можно использовать для:
- Проверка документов: Автоматическая проверка наличия и подлинности человеческих подписей в документах.
- Обнаружение мошенничества: Выявление поддельных или мошеннических подписей в юридических и финансовых документах.
- Архивные исследования: Помощь историкам и архивистам в цифровом анализе и каталогизации исторических документов.
- Образование: Поддержка академических исследований и преподавания в области компьютерного зрения и машинного обучения.
- Финансовые услуги: Повышение безопасности банковских операций и оформления кредитов путем проверки подлинности подписи.
Как сделать вывод, используя модель, обученную на наборе данных Signature Detection Dataset?
Чтобы сделать вывод с помощью модели, обученной на наборе данных Signature Detection Dataset, выполните следующие действия:
- Загрузите отлаженную модель.
- Используйте приведенный ниже скрипт Python или команду CLI для выполнения вывода:
Пример вывода
Какова структура набора данных Signature Detection Dataset и где можно найти дополнительную информацию?
Набор данных для обнаружения подписей разделен на два подмножества:
- Набор для обучения: Содержит 143 изображения с аннотациями.
- Набор для проверки: Включает 35 изображений с аннотациями.
Для получения подробной информации вы можете обратиться к Структура набора данных раздел. Кроме того, просмотрите полную конфигурацию набора данных в разделе signature.yaml
файл, расположенный по адресу signature.yaml.