Zum Inhalt springen

Signatur-Erkennungsdatensatz

This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.

Struktur des Datensatzes

Der Datensatz zur Erkennung von Unterschriften wird in drei Teilmengen aufgeteilt:

  • Trainingsset: Enthält 143 Bilder, jedes mit entsprechenden Anmerkungen.
  • Validierungsset: Enthält 35 Bilder, jeweils mit gepaarten Kommentaren.

Anwendungen

Dieser Datensatz kann für verschiedene Computer-Vision-Aufgaben wie Objekterkennung, Objektverfolgung und Dokumentenanalyse verwendet werden. Insbesondere können damit Modelle zur Erkennung von Unterschriften in Dokumenten trainiert und ausgewertet werden, die in der Dokumentenprüfung, der Betrugserkennung und der Archivforschung Anwendung finden können. Darüber hinaus kann es als wertvolle Ressource für Bildungszwecke dienen, die es Studierenden und Forschern ermöglicht, die Merkmale und das Verhalten von Unterschriften in verschiedenen Dokumenttypen zu untersuchen und zu verstehen.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) definiert die Konfiguration des Datensatzes, einschließlich der Pfade und Klasseninformationen. Für den Signaturerkennungsdatensatz wird die signature.yaml Datei befindet sich unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Verwendung

To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Beispiel für eine Schlussfolgerung

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Beispielbilder und Anmerkungen

Der Datensatz zur Erkennung von Unterschriften umfasst eine Vielzahl von Bildern, die verschiedene Dokumententypen und kommentierte Unterschriften zeigen. Nachfolgend findest du Beispiele für Bilder aus dem Datensatz, die jeweils mit den entsprechenden Kommentaren versehen sind.

Beispielbild aus dem Datensatz zur Erkennung von Unterschriften

  • Mosaikbild: Hier stellen wir einen Trainingsstapel vor, der aus Mosaikbildern des Datensatzes besteht. Bei der Mosaikbildung werden mehrere Bilder zu einem einzigen zusammengefügt, um die Vielfalt des Stapels zu erhöhen. Diese Methode trägt dazu bei, die Generalisierbarkeit des Modells über verschiedene Signaturgrößen, Seitenverhältnisse und Kontexte hinweg zu verbessern.

Dieses Beispiel veranschaulicht die Vielfalt und Komplexität der Bilder im Signaturerkennungsdatensatz und verdeutlicht die Vorteile der Mosaikbildung während des Trainingsprozesses.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 Lizenz veröffentlicht.

FAQ

Was ist der Signature Detection Dataset und wie kann er genutzt werden?

The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.

How do I train a YOLO11n model on the Signature Detection Dataset?

To train a YOLO11n model on the Signature Detection Dataset, follow these steps:

  1. Download der signature.yaml Dataset-Konfigurationsdatei von signature.yaml.
  2. Verwende das folgende Python Skript oder den CLI Befehl, um das Training zu starten:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Weitere Informationen findest du auf der Seite Ausbildung.

Was sind die wichtigsten Anwendungen des Signature Detection Dataset?

Der Signature Detection Dataset kann verwendet werden für:

  1. Dokumentenüberprüfung: Automatisches Überprüfen des Vorhandenseins und der Echtheit menschlicher Unterschriften in Dokumenten.
  2. Aufdeckung von Betrug: Erkennen von gefälschten oder betrügerischen Unterschriften in Rechts- und Finanzdokumenten.
  3. Archivarische Forschung: Unterstützung von Historikern und Archivaren bei der digitalen Analyse und Katalogisierung von historischen Dokumenten.
  4. Education: Supporting academic research and teaching in the fields of computer vision and machine learning.

Wie kann ich mit einem Modell, das mit dem Signature Detection Dataset trainiert wurde, Inferenzen durchführen?

Um mit einem Modell, das mit dem Signature Detection Dataset trainiert wurde, Rückschlüsse zu ziehen, befolge diese Schritte:

  1. Lade dein feinabgestimmtes Modell.
  2. Verwende das folgende Python Skript oder den CLI Befehl, um Inferenzen durchzuführen:

Beispiel für eine Schlussfolgerung

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Wie ist der Signature Detection Dataset aufgebaut und wo kann ich weitere Informationen finden?

Der Signaturerkennungsdatensatz ist in zwei Teilmengen unterteilt:

  • Training Set: Enthält 143 Bilder mit Annotationen.
  • Validierungsset: Enthält 35 Bilder mit Kommentaren.

Ausführliche Informationen findest du in der Struktur des Datensatzes Abschnitt. Außerdem kannst du die vollständige Konfiguration des Datensatzes im Abschnitt signature.yaml Die Datei befindet sich unter signature.yaml.

📅 Created 5 months ago ✏️ Updated 1 month ago

Kommentare