Datensatz zur Signaturerkennung

Dieser Datensatz konzentriert sich auf das Erkennen handschriftlicher Unterschriften in Dokumenten. Er enthält eine Vielzahl von Dokumententypen mit annotierten Unterschriften und liefert wertvolle Einblicke für Anwendungen in der Dokumentenprüfung und Betrugserkennung. Dieser Datensatz ist für das Training von computer vision-Algorithmen unerlässlich und hilft bei der Identifizierung von Unterschriften in verschiedenen Dokumentenformaten, wodurch Forschung und praktische Anwendungen in der Dokumentenanalyse unterstützt werden.

Datensatzstruktur

Der Datensatz zur Signaturerkennung ist in zwei Teilmengen unterteilt:

  • Trainingsmenge: Enthält 143 Bilder mit den jeweils zugehörigen Annotationen.
  • Validierungsmenge: Enthält 35 Bilder mit den jeweils zugehörigen Annotationen.

Anwendungen

Dieser Datensatz kann für verschiedene Computer-Vision-Aufgaben wie object detection, object tracking und Dokumentenanalyse verwendet werden. Insbesondere kann er genutzt werden, um Modelle für die Identifizierung von Unterschriften in Dokumenten zu trainieren und zu bewerten, was bedeutende Anwendungsmöglichkeiten bietet in:

  • Dokumentenprüfung: Automatisierung des Verifizierungsprozesses für rechtliche und finanzielle Dokumente
  • Betrugserkennung: Identifizierung potenziell gefälschter oder unbefugter Unterschriften
  • Digitale Dokumentenverarbeitung: Optimierung von Arbeitsabläufen in Verwaltungs- und Rechtsbereichen
  • Banken und Finanzwesen: Erhöhung der Sicherheit bei der Scheckverarbeitung und der Prüfung von Kreditunterlagen
  • Archivforschung: Unterstützung der Analyse und Katalogisierung historischer Dokumente

Zusätzlich dient er als wertvolle Ressource für Bildungszwecke, da er Studierenden und Forschenden ermöglicht, Signaturmerkmale über verschiedene Dokumententypen hinweg zu untersuchen.

Datensatz-YAML

Eine YAML (Yet Another Markup Language)-Datei definiert die Konfiguration des Datensatzes, einschließlich Pfaden und Klasseninformationen. Für den Datensatz zur Signaturerkennung befindet sich die signature.yaml-Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Verwendung

Um ein YOLO26n-Modell auf dem Datensatz zur Signaturerkennung für 100 epochs bei einer Bildgröße von 640 zu trainieren, verwende die bereitgestellten Codebeispiele. Eine umfassende Liste der verfügbaren Parameter findest du auf der Seite Training des Modells.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
Inferenzbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Beispielbilder und Annotationen

Der Datensatz zur Signaturerkennung umfasst eine große Vielfalt an Bildern, die verschiedene Dokumententypen und annotierte Unterschriften zeigen. Nachfolgend findest du Beispiele von Bildern aus dem Datensatz, jeweils begleitet von den zugehörigen Annotationen.

Beispielbild des Datensatzes zur Signaturerkennung

  • Mosaik-Bild: Hier präsentieren wir einen Trainingsstapel, der aus mosaikierten Datensatzbildern besteht. Mosaicing, eine Trainingstechnik, kombiniert mehrere Bilder zu einem, was die Vielfalt der Stapel bereichert. Diese Methode hilft, die Fähigkeit des Modells zu verbessern, über verschiedene Signaturgrößen, Seitenverhältnisse und Kontexte hinweg zu verallgemeinern.

Dieses Beispiel veranschaulicht die Vielfalt und Komplexität der Bilder im Datensatz zur Signaturerkennung und hebt die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses hervor.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 License veröffentlicht.

FAQ

Was ist der Datensatz zur Signaturerkennung und wie kann er verwendet werden?

Der Datensatz zur Signaturerkennung ist eine Sammlung annotierter Bilder, die darauf abzielen, menschliche Unterschriften in verschiedenen Dokumententypen zu erkennen. Er kann bei Computer-Vision-Aufgaben wie object detection und Tracking angewendet werden, vorrangig für Dokumentenprüfung, Betrugserkennung und Archivforschung. Dieser Datensatz hilft beim Training von Modellen, um Unterschriften in verschiedenen Kontexten zu erkennen, was ihn wertvoll sowohl für die Forschung als auch für praktische Anwendungen in der smart document analysis macht.

Wie trainiere ich ein YOLO26n-Modell mit dem Datensatz zur Signaturerkennung?

Um ein YOLO26n-Modell mit dem Datensatz zur Signaturerkennung zu trainieren, befolge diese Schritte:

  1. Lade die Konfigurationsdatei signature.yaml unter signature.yaml herunter.
  2. Verwende das folgende Python-Skript oder den CLI-Befehl, um das Training zu starten:
Trainingsbeispiel
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Weitere Details findest du auf der Seite Training.

Was sind die Hauptanwendungen des Datensatzes zur Signaturerkennung?

Der Datensatz zur Signaturerkennung kann für Folgendes verwendet werden:

  1. Dokumentenprüfung: Automatische Überprüfung des Vorhandenseins und der Echtheit menschlicher Unterschriften in Dokumenten.
  2. Betrugserkennung: Identifizierung gefälschter oder betrügerischer Unterschriften in Rechts- und Finanzdokumenten.
  3. Archivforschung: Unterstützung von Historikern und Archivaren bei der digitalen Analyse und Katalogisierung historischer Dokumente.
  4. Bildung: Unterstützung akademischer Forschung und Lehre in den Bereichen Computer Vision und machine learning.
  5. Finanzdienstleistungen: Verbesserung der Sicherheit bei Banktransaktionen und Kreditbearbeitung durch Überprüfung der Echtheit von Unterschriften.

Wie kann ich eine Inferenz mit einem Modell durchführen, das mit dem Datensatz zur Signaturerkennung trainiert wurde?

Um eine Inferenz mit einem Modell durchzuführen, das mit dem Datensatz zur Signaturerkennung trainiert wurde, befolge diese Schritte:

  1. Lade dein feinabgestimmtes Modell.
  2. Verwende das untenstehende Python-Skript oder den CLI-Befehl, um die Inferenz durchzuführen:
Inferenzbeispiel
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Wie ist der Datensatz zur Signaturerkennung aufgebaut und wo finde ich weitere Informationen?

Der Datensatz zur Signaturerkennung ist in zwei Teilmengen unterteilt:

  • Trainingsmenge: Enthält 143 Bilder mit Annotationen.
  • Validierungsmenge: Enthält 35 Bilder mit Annotationen.

Detaillierte Informationen findest du im Abschnitt Dataset Structure. Außerdem kannst du die vollständige Datensatzkonfiguration in der Datei signature.yaml unter signature.yaml einsehen.

Kommentare