Handtekeningdetectiedataset

Deze dataset richt zich op het detecteren van menselijke handtekeningen in documenten. Het bevat een verscheidenheid aan documenttypes met geannoteerde handtekeningen, wat waardevolle inzichten oplevert voor toepassingen in documentverificatie en fraudedetectie. Deze dataset is essentieel voor het trainen van computervisie-algoritmen en helpt bij het identificeren van handtekeningen in verschillende documentformaten, ter ondersteuning van onderzoek en praktische toepassingen in documentanalyse.

Structuur dataset

De dataset voor handtekeningdetectie is opgesplitst in drie subsets:

Trainingsset: Bevat 143 afbeeldingen, elk met bijbehorende annotaties.
Validatieset: Bevat 35 afbeeldingen, elk met gekoppelde annotaties.

Toepassingen

Deze dataset kan worden toegepast in verschillende computer vision taken zoals objectdetectie, het volgen van objecten en documentanalyse. In het bijzonder kan het gebruikt worden om modellen te trainen en te evalueren voor het identificeren van handtekeningen in documenten, wat toepassingen kan hebben in documentverificatie, fraudedetectie en archiefonderzoek. Daarnaast kan het dienen als een waardevolle bron voor educatieve doeleinden, waarmee studenten en onderzoekers de kenmerken en het gedrag van handtekeningen in verschillende documenttypen kunnen bestuderen en begrijpen.

Dataset YAML

Een YAML-bestand (Yet Another Markup Language) definieert de configuratie van de dataset, inclusief paden en klasseninformatie. Voor de handtekeningdetectie dataset is de signature.yaml bestand bevindt zich op https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Gebruik

Om een YOLOv8n model te trainen op de handtekeningdetectie dataset voor 100 epochs met een afbeeldingsgrootte van 640, gebruik je de meegeleverde codevoorbeelden. Raadpleeg de pagina Training van het model voor een uitgebreide lijst van beschikbare parameters.

Voorbeeld trein

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Voorbeeld van gevolgtrekking

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Voorbeeldafbeeldingen en -annotaties

De dataset voor handtekeningdetectie bestaat uit een grote verscheidenheid aan afbeeldingen van verschillende documenttypen en geannoteerde handtekeningen. Hieronder staan voorbeelden van afbeeldingen uit de dataset, elk vergezeld van de bijbehorende annotaties.

Voorbeeldafbeelding handtekeningdetectie dataset

Gemozaïekte afbeelding: Hier presenteren we een trainingsbatch bestaande uit gemozaïekte afbeeldingen van de dataset. Bij mozaïeken, een trainingstechniek, worden meerdere beelden gecombineerd tot één beeld, wat de diversiteit van de batch verrijkt. Deze methode helpt het vermogen van het model om te generaliseren over verschillende signatuurgroottes, aspectratio's en contexten te verbeteren.

Dit voorbeeld illustreert de variëteit en complexiteit van afbeeldingen in de signature Detection Dataset, en benadrukt de voordelen van het opnemen van mozaïek tijdens het trainingsproces.

Citaten en erkenningen

De dataset is vrijgegeven onder de AGPL-3.0 Licentie.

Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)