Zum Inhalt springen

Signatur-Erkennungsdatensatz

Dieser Datensatz konzentriert sich auf die Erkennung von menschlichen Unterschriften in Dokumenten. Er umfasst eine Vielzahl von Dokumenttypen mit kommentierten Unterschriften und liefert wertvolle Erkenntnisse für Anwendungen in der Dokumentenprüfung und Betrugserkennung. Dieser Datensatz ist für das Training von Computer-Vision-Algorithmen unverzichtbar und hilft bei der Erkennung von Unterschriften in verschiedenen Dokumentenformaten und unterstützt Forschung und praktische Anwendungen in der Dokumentenanalyse.

Struktur des Datensatzes

Der Datensatz zur Erkennung von Signaturen wird in drei Teilmengen aufgeteilt:

  • Übungssatz: Enthält 143 Bilder, jeweils mit entsprechenden Anmerkungen.
  • Validierungssatz: Umfasst 35 Bilder, jeweils mit gepaarten Kommentaren.

Anwendungen

Dieser Datensatz kann für verschiedene Computer-Vision-Aufgaben wie Objekterkennung, Objektverfolgung und Dokumentenanalyse verwendet werden. Insbesondere können damit Modelle zur Erkennung von Unterschriften in Dokumenten trainiert und evaluiert werden, die in der Dokumentenprüfung, der Betrugserkennung und der Archivforschung Anwendung finden können. Darüber hinaus kann es als wertvolle Ressource für Ausbildungszwecke dienen, die es Studenten und Forschern ermöglicht, die Merkmale und das Verhalten von Unterschriften in verschiedenen Dokumenttypen zu untersuchen und zu verstehen.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) definiert die Konfiguration des Datensatzes, einschließlich der Pfade und Klasseninformationen. Für den Signaturerkennungsdatensatz wird die signature.yaml Datei befindet sich unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Verwendung

Um ein YOLO11n-Modell auf dem Signaturerkennungsdatensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwenden Sie die mitgelieferten Codebeispiele. Eine umfassende Liste der verfügbaren Parameter finden Sie auf der Seite Training des Modells.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Beispiel für eine Schlussfolgerung

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Beispielbilder und -kommentare

Der Signaturerkennungsdatensatz umfasst eine Vielzahl von Bildern, die verschiedene Dokumenttypen und kommentierte Signaturen zeigen. Nachfolgend finden Sie Beispiele von Bildern aus dem Datensatz, die jeweils mit den entsprechenden Anmerkungen versehen sind.

Signaturerkennungsdatensatz Beispielbild

  • Mosaikbild: Hier stellen wir einen Trainingsstapel vor, der aus Mosaikbildern des Datensatzes besteht. Bei dieser Trainingstechnik werden mehrere Bilder zu einem einzigen zusammengefügt, um die Vielfalt des Stapels zu erhöhen. Diese Methode trägt dazu bei, die Fähigkeit des Modells zur Generalisierung über verschiedene Signaturgrößen, Seitenverhältnisse und Kontexte hinweg zu verbessern.

Dieses Beispiel veranschaulicht die Vielfalt und Komplexität der Bilder im Signaturerkennungsdatensatz und verdeutlicht die Vorteile der Mosaikbildung während des Trainingsprozesses.

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 Lizenz veröffentlicht.

FAQ

Was ist der Signature Detection Dataset und wie kann er verwendet werden?

Der Signature Detection Dataset ist eine Sammlung kommentierter Bilder zur Erkennung menschlicher Unterschriften in verschiedenen Dokumenttypen. Er kann bei Computer-Vision-Aufgaben wie der Erkennung und Verfolgung von Objekten eingesetzt werden, vor allem bei der Dokumentenüberprüfung, der Erkennung von Betrug und der Archivforschung. Dieser Datensatz hilft beim Trainieren von Modellen zur Erkennung von Unterschriften in verschiedenen Kontexten, was ihn sowohl für die Forschung als auch für praktische Anwendungen wertvoll macht.

Wie trainiere ich ein YOLO11n-Modell mit dem Signature Detection Dataset?

Um ein YOLO11n-Modell auf dem Signature Detection Dataset zu trainieren, gehen Sie wie folgt vor:

  1. Herunterladen der signature.yaml Dataset-Konfigurationsdatei von unterschrift.yaml.
  2. Verwenden Sie das folgende Skript Python oder den Befehl CLI , um das Training zu starten:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Weitere Einzelheiten finden Sie auf der Seite Ausbildung.

Was sind die wichtigsten Anwendungen des Signature Detection Dataset?

Der Signature Detection Dataset kann für folgende Zwecke verwendet werden:

  1. Überprüfung von Dokumenten: Automatische Überprüfung des Vorhandenseins und der Echtheit von menschlichen Unterschriften in Dokumenten.
  2. Aufdeckung von Betrug: Erkennung von gefälschten oder betrügerischen Unterschriften in Rechts- und Finanzdokumenten.
  3. Archivarische Forschung: Unterstützung von Historikern und Archivaren bei der digitalen Analyse und Katalogisierung von historischen Dokumenten.
  4. Bildung: Unterstützung der akademischen Forschung und Lehre in den Bereichen Computer Vision und maschinelles Lernen.

Wie kann ich mit einem Modell, das mit dem Signature Detection Dataset trainiert wurde, Inferenzen durchführen?

Führen Sie die folgenden Schritte aus, um eine Inferenz mit einem Modell durchzuführen, das mit dem Signature Detection Dataset trainiert wurde:

  1. Laden Sie Ihr fein abgestimmtes Modell.
  2. Verwenden Sie das nachstehende Skript Python oder den Befehl CLI , um die Inferenz durchzuführen:

Beispiel für eine Schlussfolgerung

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Wie ist der Signature Detection Dataset aufgebaut, und wo finde ich weitere Informationen?

Der Signaturerkennungsdatensatz ist in zwei Teilmengen unterteilt:

  • Übungssatz: Enthält 143 Bilder mit Annotationen.
  • Validierungssatz: Enthält 35 Bilder mit Anmerkungen.

Ausführliche Informationen finden Sie in der Struktur des Datensatzes Abschnitt. Außerdem können Sie die vollständige Konfiguration des Datensatzes im Abschnitt signature.yaml Die Datei befindet sich unter unterschrift.yaml.

📅 Created 7 months ago ✏️ Updated 3 months ago

Kommentare