Zum Inhalt springen

Datensatz zur Signaturerkennung

Dieser Datensatz konzentriert sich auf die Erkennung von handschriftlichen Unterschriften in Dokumenten. Er umfasst eine Vielzahl von Dokumenttypen mit annotierten Unterschriften und bietet wertvolle Einblicke für Anwendungen in der Dokumentenprüfung und Betrugserkennung. Dieser Datensatz ist essenziell für das Training von Computer Vision-Algorithmen und hilft bei der Identifizierung von Unterschriften in verschiedenen Dokumentformaten und unterstützt Forschung und praktische Anwendungen in der Dokumentenanalyse.

Dataset-Struktur

Der Signature-Detection-Datensatz ist in zwei Teilmengen unterteilt:

  • Trainingssatz: Enthält 143 Bilder, jedes mit entsprechenden Anmerkungen.
  • Validierungsdatensatz: Enthält 35 Bilder, jedes mit zugehörigen Annotationen.

Anwendungen

Dieser Datensatz kann in verschiedenen Computer-Vision-Aufgaben wie Objekterkennung, Objektverfolgung und Dokumentenanalyse eingesetzt werden. Insbesondere kann er verwendet werden, um Modelle zum Erkennen von Signaturen in Dokumenten zu trainieren und zu evaluieren, was bedeutende Anwendungen hat in:

  • Dokumentenprüfung: Automatisierung des Verifizierungsprozesses für Rechts- und Finanzdokumente
  • Betrugserkennung: Identifizierung potenziell gefälschter oder unbefugter Unterschriften
  • Digitale Dokumentenverarbeitung: Optimierung von Arbeitsabläufen in administrativen und juristischen Bereichen
  • Bank- und Finanzwesen: Verbesserung der Sicherheit bei der Scheckbearbeitung und der Überprüfung von Kreditunterlagen
  • Archivforschung: Unterstützung der Analyse und Katalogisierung historischer Dokumente

Zusätzlich dient es als wertvolle Ressource für Bildungszwecke und ermöglicht es Studenten und Forschern, charakteristische Merkmale verschiedener Dokumenttypen zu untersuchen.

Datensatz-YAML

Eine YAML-Datei (Yet Another Markup Language) definiert die Datensatzkonfiguration, einschließlich Pfade und Klasseninformationen. Für den Datensatz zur Unterschriftenerkennung ist die signature.yaml Datei befindet sich unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Nutzung

Um ein YOLO11n-Modell auf dem Datensatz zur Unterschriftenerkennung für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwenden Sie die bereitgestellten Codebeispiele. Eine umfassende Liste der verfügbaren Parameter finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Inferenz Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

sample_images und Anmerkungen

Der Datensatz zur Signaturerkennung umfasst eine Vielzahl von Bildern, die verschiedene Dokumenttypen und annotierte Signaturen zeigen. Nachfolgend sind Beispiele von Bildern aus dem Datensatz zusammen mit den entsprechenden Anmerkungen aufgeführt.

Beispielbild aus dem Datensatz zur Unterschriftenerkennung

  • Mosaikbild: Hier präsentieren wir einen Trainings-Batch, der aus Mosaikbildern des Datensatzes besteht. Mosaicing, eine Trainingstechnik, kombiniert mehrere Bilder zu einem einzigen und bereichert so die Batch-Vielfalt. Diese Methode trägt dazu bei, die Fähigkeit des Modells zu verbessern, über verschiedene Signaturgrößen, Seitenverhältnisse und Kontexte hinweg zu generalisieren.

Dieses Beispiel veranschaulicht die Vielfalt und Komplexität der Bilder im Signaturerkennungs-Datensatz und unterstreicht die Vorteile der Einbeziehung von Mosaicing während des Trainingsprozesses.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0-Lizenz veröffentlicht.

FAQ

Was ist der Signature Detection Dataset und wie kann er verwendet werden?

Der Signature Detection Dataset ist eine Sammlung annotierter Bilder, die darauf abzielt, menschliche Signaturen in verschiedenen Dokumenttypen zu erkennen. Er kann in Computer-Vision-Aufgaben wie Objekterkennung und -verfolgung eingesetzt werden, hauptsächlich für die Dokumentenprüfung, Betrugserkennung und Archivforschung. Dieser Datensatz hilft beim Trainieren von Modellen, Signaturen in verschiedenen Kontexten zu erkennen, was ihn sowohl für die Forschung als auch für praktische Anwendungen in der intelligenten Dokumentenanalyse wertvoll macht.

Wie trainiere ich ein YOLO11n-Modell auf dem Signature Detection Datensatz?

Um ein YOLO11n-Modell auf dem Signature Detection Dataset zu trainieren, führen Sie die folgenden Schritte aus:

  1. Herunterladen der signature.yaml Datensatz-Konfigurationsdatei von signature.yaml.
  2. Verwenden Sie das folgende Python-Skript oder den CLI-Befehl, um mit dem Training zu beginnen:

Trainingsbeispiel

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Weitere Informationen finden Sie auf der Seite Training.

Was sind die Hauptanwendungen des Signature Detection Datensatzes?

Der Signature Detection Dataset kann für Folgendes verwendet werden:

  1. Dokumentenverifizierung: Automatische Überprüfung der Anwesenheit und Echtheit von menschlichen Unterschriften in Dokumenten.
  2. Betrugserkennung: Identifizierung von gefälschten oder betrügerischen Unterschriften in juristischen und finanziellen Dokumenten.
  3. Archivforschung: Unterstützung von Historikern und Archivaren bei der digitalen Analyse und Katalogisierung historischer Dokumente.
  4. Bildung: Unterstützung der akademischen Forschung und Lehre in den Bereichen Computer Vision und maschinelles Lernen.
  5. Finanzdienstleistungen: Verbesserung der Sicherheit bei Banktransaktionen und Kreditbearbeitung durch Überprüfung der Echtheit von Unterschriften.

Wie kann ich Inferenz mit einem Modell durchführen, das auf dem Signature Detection Datensatz trainiert wurde?

Um eine Inferenz mit einem auf dem Signature Detection Dataset trainierten Modell durchzuführen, führen Sie die folgenden Schritte aus:

  1. Laden Sie Ihr feinabgestimmtes Modell.
  2. Verwenden Sie das untenstehende Python-Skript oder den CLI-Befehl, um eine Inferenz durchzuführen:

Inferenz Beispiel

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Wie ist der Signature Detection Datensatz aufgebaut und wo finde ich weitere Informationen?

Der Signature Detection Dataset ist in zwei Untergruppen unterteilt:

  • Trainingssatz: Enthält 143 Bilder mit Annotationen.
  • Validierungssatz: Enthält 35 Bilder mit Annotationen.

Für detaillierte Informationen können Sie sich auf den Dataset-Struktur Abschnitt beziehen. Sehen Sie sich zusätzlich die vollständige Datensatzkonfiguration in der signature.yaml Datei unter signature.yaml.



📅 Vor 1 Jahr erstellt ✏️ Vor 5 Monaten aktualisiert

Kommentare