Overslaan naar inhoud

Handtekeningdetectiedataset

Deze dataset richt zich op het detecteren van menselijke handtekeningen in documenten. Het bevat een verscheidenheid aan documenttypes met geannoteerde handtekeningen, wat waardevolle inzichten oplevert voor toepassingen in documentverificatie en fraudedetectie. Deze dataset is essentieel voor het trainen van computervisie-algoritmen en helpt bij het identificeren van handtekeningen in verschillende documentformaten, ter ondersteuning van onderzoek en praktische toepassingen in documentanalyse.

Structuur dataset

De dataset voor handtekeningdetectie is opgesplitst in drie subsets:

  • Trainingsset: Bevat 143 afbeeldingen, elk met bijbehorende annotaties.
  • Validatieset: Bevat 35 afbeeldingen, elk met gekoppelde annotaties.

Toepassingen

Deze dataset kan worden toegepast in verschillende computer vision taken zoals objectdetectie, het volgen van objecten en documentanalyse. In het bijzonder kan het gebruikt worden om modellen te trainen en te evalueren voor het identificeren van handtekeningen in documenten, wat toepassingen kan hebben in documentverificatie, fraudedetectie en archiefonderzoek. Daarnaast kan het dienen als een waardevolle bron voor educatieve doeleinden, waarmee studenten en onderzoekers de kenmerken en het gedrag van handtekeningen in verschillende documenttypen kunnen bestuderen en begrijpen.

Dataset YAML

Een YAML-bestand (Yet Another Markup Language) definieert de configuratie van de dataset, inclusief paden en klasseninformatie. Voor de handtekeningdetectie dataset is de signature.yaml bestand bevindt zich op https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Gebruik

Om een YOLOv8n model te trainen op de handtekeningdetectie dataset voor 100 epochs met een afbeeldingsgrootte van 640, gebruik je de meegeleverde codevoorbeelden. Raadpleeg de pagina Training van het model voor een uitgebreide lijst van beschikbare parameters.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Voorbeeld van gevolgtrekking

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Voorbeeldafbeeldingen en -annotaties

De dataset voor handtekeningdetectie bestaat uit een grote verscheidenheid aan afbeeldingen van verschillende documenttypen en geannoteerde handtekeningen. Hieronder staan voorbeelden van afbeeldingen uit de dataset, elk vergezeld van de bijbehorende annotaties.

Voorbeeldafbeelding handtekeningdetectie dataset

  • Gemozaïekte afbeelding: Hier presenteren we een trainingsbatch bestaande uit gemozaïekte afbeeldingen van de dataset. Bij mozaïeken, een trainingstechniek, worden meerdere beelden gecombineerd tot één beeld, wat de diversiteit van de batch verrijkt. Deze methode helpt het vermogen van het model om te generaliseren over verschillende signatuurgroottes, aspectratio's en contexten te verbeteren.

Dit voorbeeld illustreert de variëteit en complexiteit van afbeeldingen in de signature Detection Dataset, en benadrukt de voordelen van het opnemen van mozaïek tijdens het trainingsproces.

Citaten en erkenningen

De dataset is vrijgegeven onder de AGPL-3.0 Licentie.

FAQ

Wat is de Signature Detection Dataset en hoe kan deze worden gebruikt?

De Signature Detection Dataset is een verzameling geannoteerde afbeeldingen gericht op het detecteren van menselijke handtekeningen in verschillende soorten documenten. Het kan worden toegepast in computervisietaken zoals objectdetectie en -tracering, voornamelijk voor documentverificatie, fraudedetectie en archiefonderzoek. Deze dataset helpt modellen te trainen om handtekeningen in verschillende contexten te herkennen, waardoor het waardevol is voor zowel onderzoek als praktische toepassingen.

Hoe train ik een YOLOv8n model op de Signature Detection Dataset?

Volg deze stappen om een YOLOv8n model te trainen op de Signature Detection Dataset:

  1. Downloaden signature.yaml dataset configuratiebestand van handtekening.yaml.
  2. Gebruik het volgende Python script of CLI commando om de training te starten:

Voorbeeld trein

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Raadpleeg de pagina Training voor meer informatie.

Wat zijn de belangrijkste toepassingen van de Signature Detection Dataset?

De Signature Detection Dataset kan worden gebruikt voor:

  1. Documentverificatie: Automatisch verifiëren van de aanwezigheid en echtheid van menselijke handtekeningen in documenten.
  2. Fraudedetectie: Identificeren van vervalste of frauduleuze handtekeningen in juridische en financiële documenten.
  3. Archiefonderzoek: Historici en archivarissen helpen bij de digitale analyse en catalogisering van historische documenten.
  4. Onderwijs: Ondersteuning van academisch onderzoek en onderwijs op het gebied van computer vision en machine learning.

Hoe kan ik inferentie uitvoeren met een model dat is getraind op de Signature Detection Dataset?

Volg deze stappen om inferentie uit te voeren met een model dat is getraind op de Signature Detection Dataset:

  1. Laad je verfijnde model.
  2. Gebruik het onderstaande Python script of CLI commando om inferentie uit te voeren:

Voorbeeld van gevolgtrekking

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Wat is de structuur van de Signature Detection Dataset en waar kan ik meer informatie vinden?

De Signature Detection Dataset is verdeeld in twee subsets:

  • Trainingsset: Bevat 143 afbeeldingen met annotaties.
  • Validatieset: Bevat 35 afbeeldingen met annotaties.

Voor gedetailleerde informatie kun je de Structuur dataset sectie. Bekijk daarnaast de volledige configuratie van de dataset in de signature.yaml bestand op handtekening.yaml.



Gemaakt op 2024-05-22, Bijgewerkt op 2024-07-04
Auteurs: glenn-jocher (2), RizwanMunawar (1)

Reacties