Zum Inhalt springen

Signatur-Erkennungsdatensatz

Dieser Datensatz konzentriert sich auf die Erkennung von menschlichen Unterschriften in Dokumenten. Er umfasst eine Vielzahl von Dokumenttypen mit kommentierten Unterschriften und liefert wertvolle Erkenntnisse f├╝r Anwendungen in der Dokumentenpr├╝fung und Betrugserkennung. Dieser Datensatz ist f├╝r das Training von Computer-Vision-Algorithmen unerl├Ąsslich und hilft bei der Erkennung von Unterschriften in verschiedenen Dokumentenformaten, um Forschung und praktische Anwendungen in der Dokumentenanalyse zu unterst├╝tzen.

Struktur des Datensatzes

Der Datensatz zur Erkennung von Unterschriften wird in drei Teilmengen aufgeteilt:

  • Trainingsset: Enth├Ąlt 143 Bilder, jedes mit entsprechenden Anmerkungen.
  • Validierungsset: Enth├Ąlt 35 Bilder, jeweils mit gepaarten Kommentaren.

Anwendungen

Dieser Datensatz kann f├╝r verschiedene Computer-Vision-Aufgaben wie Objekterkennung, Objektverfolgung und Dokumentenanalyse verwendet werden. Insbesondere k├Ânnen damit Modelle zur Erkennung von Unterschriften in Dokumenten trainiert und ausgewertet werden, die in der Dokumentenpr├╝fung, der Betrugserkennung und der Archivforschung Anwendung finden k├Ânnen. Dar├╝ber hinaus kann es als wertvolle Ressource f├╝r Bildungszwecke dienen, die es Studierenden und Forschern erm├Âglicht, die Merkmale und das Verhalten von Unterschriften in verschiedenen Dokumenttypen zu untersuchen und zu verstehen.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) definiert die Konfiguration des Datensatzes, einschlie├člich der Pfade und Klasseninformationen. F├╝r den Signaturerkennungsdatensatz wird die signature.yaml Datei befindet sich unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO ­čÜÇ, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ÔöťÔöÇÔöÇ ultralytics
# ÔööÔöÇÔöÇ datasets
#     ÔööÔöÇÔöÇ signature  ÔćÉ downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Verwendung

Um ein YOLOv8n Modell auf dem Signaturerkennungsdatensatz f├╝r 100 Epochen mit einer Bildgr├Â├če von 640 zu trainieren, verwende die mitgelieferten Codebeispiele. Eine umfassende Liste der verf├╝gbaren Parameter findest du auf der Seite Training des Modells.

Beispiel f├╝r einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Beispiel f├╝r eine Schlussfolgerung

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Beispielbilder und Anmerkungen

Der Datensatz zur Erkennung von Unterschriften umfasst eine Vielzahl von Bildern, die verschiedene Dokumententypen und kommentierte Unterschriften zeigen. Nachfolgend findest du Beispiele f├╝r Bilder aus dem Datensatz, die jeweils mit den entsprechenden Kommentaren versehen sind.

Beispielbild aus dem Datensatz zur Erkennung von Unterschriften

  • Mosaikbild: Hier stellen wir einen Trainingsstapel vor, der aus Mosaikbildern des Datensatzes besteht. Bei der Mosaikbildung werden mehrere Bilder zu einem einzigen zusammengef├╝gt, um die Vielfalt des Stapels zu erh├Âhen. Diese Methode tr├Ągt dazu bei, die Generalisierbarkeit des Modells ├╝ber verschiedene Signaturgr├Â├čen, Seitenverh├Ąltnisse und Kontexte hinweg zu verbessern.

Dieses Beispiel veranschaulicht die Vielfalt und Komplexit├Ąt der Bilder im Signaturerkennungsdatensatz und verdeutlicht die Vorteile der Mosaikbildung w├Ąhrend des Trainingsprozesses.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 Lizenz ver├Âffentlicht.

FAQ

Was ist der Signature Detection Dataset und wie kann er genutzt werden?

Der Signature Detection Dataset ist eine Sammlung kommentierter Bilder, die darauf abzielt, menschliche Unterschriften in verschiedenen Dokumenttypen zu erkennen. Er kann bei Computer-Vision-Aufgaben wie der Erkennung und Verfolgung von Objekten eingesetzt werden, vor allem bei der ├ťberpr├╝fung von Dokumenten, der Erkennung von Betrug und in der Archivforschung. Mit diesem Datensatz lassen sich Modelle zur Erkennung von Unterschriften in verschiedenen Kontexten trainieren, was ihn sowohl f├╝r die Forschung als auch f├╝r praktische Anwendungen wertvoll macht.

Wie trainiere ich ein YOLOv8n Modell mit dem Signature Detection Dataset?

Um ein YOLOv8n Modell auf dem Signature Detection Dataset zu trainieren, befolge diese Schritte:

  1. Download der signature.yaml Dataset-Konfigurationsdatei von signature.yaml.
  2. Verwende das folgende Python Skript oder den CLI Befehl, um das Training zu starten:

Beispiel f├╝r einen Zug

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Weitere Informationen findest du auf der Seite Ausbildung.

Was sind die wichtigsten Anwendungen des Signature Detection Dataset?

Der Signature Detection Dataset kann verwendet werden f├╝r:

  1. Dokumenten├╝berpr├╝fung: Automatisches ├ťberpr├╝fen des Vorhandenseins und der Echtheit menschlicher Unterschriften in Dokumenten.
  2. Aufdeckung von Betrug: Erkennen von gef├Ąlschten oder betr├╝gerischen Unterschriften in Rechts- und Finanzdokumenten.
  3. Archivarische Forschung: Unterst├╝tzung von Historikern und Archivaren bei der digitalen Analyse und Katalogisierung von historischen Dokumenten.
  4. Bildung: Unterst├╝tzung der akademischen Forschung und Lehre in den Bereichen Computer Vision und maschinelles Lernen.

Wie kann ich mit einem Modell, das mit dem Signature Detection Dataset trainiert wurde, Inferenzen durchf├╝hren?

Um mit einem Modell, das mit dem Signature Detection Dataset trainiert wurde, R├╝ckschl├╝sse zu ziehen, befolge diese Schritte:

  1. Lade dein feinabgestimmtes Modell.
  2. Verwende das folgende Python Skript oder den CLI Befehl, um Inferenzen durchzuf├╝hren:

Beispiel f├╝r eine Schlussfolgerung

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Wie ist der Signature Detection Dataset aufgebaut und wo kann ich weitere Informationen finden?

Der Signaturerkennungsdatensatz ist in zwei Teilmengen unterteilt:

  • Training Set: Enth├Ąlt 143 Bilder mit Annotationen.
  • Validierungsset: Enth├Ąlt 35 Bilder mit Kommentaren.

Ausf├╝hrliche Informationen findest du in der Struktur des Datensatzes Abschnitt. Au├čerdem kannst du die vollst├Ąndige Konfiguration des Datensatzes im Abschnitt signature.yaml Die Datei befindet sich unter signature.yaml.



Erstellt 2024-05-22, Aktualisiert 2024-07-04
Autoren: glenn-jocher (2), RizwanMunawar (1)

Kommentare