Vai al contenuto

Dataset per il rilevamento della firma

Questo set di dati si concentra sul rilevamento di firme scritte dall'uomo all'interno dei documenti. Include una varietà di tipi di documenti con firme annotate, fornendo preziose indicazioni per le applicazioni di verifica dei documenti e di rilevamento delle frodi. Essenziale per l'addestramento degli algoritmi di computer vision, questo set di dati aiuta a identificare le firme in vari formati di documenti, supportando la ricerca e le applicazioni pratiche nell'analisi dei documenti.

Struttura del set di dati

Il set di dati per il rilevamento delle firme è suddiviso in tre sottoinsiemi:

  • Set di allenamento: Contiene 143 immagini, ciascuna con le relative annotazioni.
  • Set di convalida: Include 35 immagini, ciascuna con annotazioni accoppiate.

Applicazioni

Questo set di dati può essere applicato a diverse attività di computer vision come il rilevamento di oggetti, il tracciamento di oggetti e l'analisi di documenti. In particolare, può essere utilizzato per addestrare e valutare modelli per l'identificazione delle firme nei documenti, che possono trovare applicazione nella verifica dei documenti, nel rilevamento delle frodi e nella ricerca archivistica. Inoltre, può fungere da preziosa risorsa a scopo didattico, consentendo a studenti e ricercatori di studiare e comprendere le caratteristiche e i comportamenti delle firme in diversi tipi di documenti.

Set di dati YAML

Un file YAML (Yet Another Markup Language) definisce la configurazione del set di dati, compresi i percorsi e le informazioni sulle classi. Per il set di dati sul rilevamento delle firme, il file signature.yaml Il file si trova all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Utilizzo

Per addestrare un modello YOLOv8n sul dataset di rilevamento delle firme per 100 epoche con una dimensione dell'immagine di 640, usa gli esempi di codice forniti. Per un elenco completo dei parametri disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Esempio di inferenza

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Immagini di esempio e annotazioni

Il set di dati per il rilevamento delle firme comprende un'ampia varietà di immagini che mostrano diversi tipi di documenti e firme annotate. Di seguito sono riportati alcuni esempi di immagini tratte dal dataset, ciascuna accompagnata dalle relative annotazioni.

Immagine campione del set di dati per il rilevamento della firma

  • Immagine mosaicata: Qui presentiamo un batch di formazione composto da immagini del dataset mosaicate. La mosaicatura, una tecnica di formazione, combina più immagini in una sola, arricchendo la diversità del lotto. Questo metodo aiuta a migliorare la capacità del modello di generalizzarsi a diverse dimensioni di firma, rapporti di aspetto e contesti.

Questo esempio illustra la varietà e la complessità delle immagini presenti nel Dataset di rilevamento delle firme, sottolineando i vantaggi dell'inclusione della mosaicatura durante il processo di formazione.

Citazioni e ringraziamenti

Il set di dati è stato rilasciato con la licenzaAGPL-3.0 .



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Commenti