Zum Inhalt springen

Signatur-Erkennungsdatensatz

Dieser Datensatz konzentriert sich auf die Erkennung von menschlichen Unterschriften in Dokumenten. Er umfasst eine Vielzahl von Dokumenttypen mit kommentierten Unterschriften und liefert wertvolle Erkenntnisse fĂŒr Anwendungen in der DokumentenprĂŒfung und Betrugserkennung. Dieser Datensatz ist fĂŒr das Training von Computer-Vision-Algorithmen unerlĂ€sslich und hilft bei der Erkennung von Unterschriften in verschiedenen Dokumentenformaten, um Forschung und praktische Anwendungen in der Dokumentenanalyse zu unterstĂŒtzen.

Struktur des Datensatzes

Der Datensatz zur Erkennung von Unterschriften wird in drei Teilmengen aufgeteilt:

  • Trainingsset: EnthĂ€lt 143 Bilder, jedes mit entsprechenden Anmerkungen.
  • Validierungsset: EnthĂ€lt 35 Bilder, jeweils mit gepaarten Kommentaren.

Anwendungen

Dieser Datensatz kann fĂŒr verschiedene Computer-Vision-Aufgaben wie Objekterkennung, Objektverfolgung und Dokumentenanalyse verwendet werden. Insbesondere können damit Modelle zur Erkennung von Unterschriften in Dokumenten trainiert und ausgewertet werden, die in der DokumentenprĂŒfung, der Betrugserkennung und der Archivforschung Anwendung finden können. DarĂŒber hinaus kann es als wertvolle Ressource fĂŒr Bildungszwecke dienen, die es Studierenden und Forschern ermöglicht, die Merkmale und das Verhalten von Unterschriften in verschiedenen Dokumenttypen zu untersuchen und zu verstehen.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) definiert die Konfiguration des Datensatzes, einschließlich der Pfade und Klasseninformationen. FĂŒr den Signaturerkennungsdatensatz wird die signature.yaml Datei befindet sich unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Verwendung

Um ein YOLOv8n Modell auf dem Signaturerkennungsdatensatz fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 640 zu trainieren, verwende die mitgelieferten Codebeispiele. Eine umfassende Liste der verfĂŒgbaren Parameter findest du auf der Seite Training des Modells.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Beispiel fĂŒr eine Schlussfolgerung

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Beispielbilder und Anmerkungen

Der Datensatz zur Erkennung von Unterschriften umfasst eine Vielzahl von Bildern, die verschiedene Dokumententypen und kommentierte Unterschriften zeigen. Nachfolgend findest du Beispiele fĂŒr Bilder aus dem Datensatz, die jeweils mit den entsprechenden Kommentaren versehen sind.

Beispielbild aus dem Datensatz zur Erkennung von Unterschriften

  • Mosaikbild: Hier stellen wir einen Trainingsstapel vor, der aus Mosaikbildern des Datensatzes besteht. Bei der Mosaikbildung werden mehrere Bilder zu einem einzigen zusammengefĂŒgt, um die Vielfalt des Stapels zu erhöhen. Diese Methode trĂ€gt dazu bei, die Generalisierbarkeit des Modells ĂŒber verschiedene SignaturgrĂ¶ĂŸen, SeitenverhĂ€ltnisse und Kontexte hinweg zu verbessern.

Dieses Beispiel veranschaulicht die Vielfalt und KomplexitÀt der Bilder im Signaturerkennungsdatensatz und verdeutlicht die Vorteile der Mosaikbildung wÀhrend des Trainingsprozesses.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 Lizenz veröffentlicht.



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Kommentare