Vai al contenuto

Dataset per il rilevamento della firma

Questo set di dati si concentra sul rilevamento di firme scritte dall'uomo all'interno dei documenti. Include una varietĂ  di tipi di documenti con firme annotate, fornendo preziose indicazioni per le applicazioni di verifica dei documenti e di rilevamento delle frodi. Essenziale per l'addestramento degli algoritmi di computer vision, questo set di dati aiuta a identificare le firme in vari formati di documenti, supportando la ricerca e le applicazioni pratiche nell'analisi dei documenti.

Struttura del set di dati

Il set di dati per il rilevamento delle firme è suddiviso in tre sottoinsiemi:

  • Set di allenamento: Contiene 143 immagini, ciascuna con le relative annotazioni.
  • Set di convalida: Include 35 immagini, ciascuna con annotazioni accoppiate.

Applicazioni

Questo set di dati può essere applicato a diverse attività di computer vision come il rilevamento di oggetti, il tracciamento di oggetti e l'analisi di documenti. In particolare, può essere utilizzato per addestrare e valutare modelli per l'identificazione delle firme nei documenti, che possono trovare applicazione nella verifica dei documenti, nel rilevamento delle frodi e nella ricerca archivistica. Inoltre, può fungere da preziosa risorsa a scopo didattico, consentendo a studenti e ricercatori di studiare e comprendere le caratteristiche e i comportamenti delle firme in diversi tipi di documenti.

Set di dati YAML

Un file YAML (Yet Another Markup Language) definisce la configurazione del set di dati, compresi i percorsi e le informazioni sulle classi. Per il set di dati sul rilevamento delle firme, il file signature.yaml Il file si trova all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilizzo

Per addestrare un modello YOLOv8n sul dataset di rilevamento delle firme per 100 epoche con una dimensione dell'immagine di 640, usa gli esempi di codice forniti. Per un elenco completo dei parametri disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Esempio di inferenza

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Immagini di esempio e annotazioni

Il set di dati per il rilevamento delle firme comprende un'ampia varietĂ  di immagini che mostrano diversi tipi di documenti e firme annotate. Di seguito sono riportati alcuni esempi di immagini tratte dal dataset, ciascuna accompagnata dalle relative annotazioni.

Immagine campione del set di dati per il rilevamento della firma

  • Immagine mosaicata: Qui presentiamo un batch di formazione composto da immagini del dataset mosaicate. La mosaicatura, una tecnica di formazione, combina piĂš immagini in una sola, arricchendo la diversitĂ  del lotto. Questo metodo aiuta a migliorare la capacitĂ  del modello di generalizzarsi a diverse dimensioni di firma, rapporti di aspetto e contesti.

Questo esempio illustra la varietĂ  e la complessitĂ  delle immagini presenti nel Dataset di rilevamento delle firme, sottolineando i vantaggi dell'inclusione della mosaicatura durante il processo di formazione.

Citazioni e ringraziamenti

Il set di dati è stato rilasciato con la licenzaAGPL-3.0 .

DOMANDE FREQUENTI

Che cos'è il Dataset di rilevamento delle firme e come può essere utilizzato?

Il Dataset Signature Detection è una raccolta di immagini annotate che hanno lo scopo di rilevare le firme umane all'interno di vari tipi di documenti. Può essere applicato a compiti di computer vision come il rilevamento e il tracciamento di oggetti, soprattutto per la verifica di documenti, il rilevamento di frodi e la ricerca archivistica. Questo set di dati aiuta ad addestrare i modelli a riconoscere le firme in diversi contesti, rendendolo prezioso sia per la ricerca che per le applicazioni pratiche.

Come si addestra un modello YOLOv8n sul dataset Signature Detection?

Per addestrare un modello YOLOv8n sul dataset Signature Detection, segui i seguenti passaggi:

  1. Scarica il sito signature.yaml file di configurazione del set di dati da signature.yaml.
  2. Usa il seguente script Python o il comando CLI per avviare la formazione:

Esempio di treno

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Per maggiori dettagli, consulta la pagina Formazione.

Quali sono le principali applicazioni del dataset Signature Detection?

Il Dataset per il rilevamento delle firme può essere utilizzato per:

  1. Verifica dei documenti: Verifica automatica della presenza e dell'autenticitĂ  delle firme umane nei documenti.
  2. Rilevamento delle frodi: Identificazione di firme false o fraudolente in documenti legali e finanziari.
  3. Ricerca archivistica: Assistere storici e archivisti nell'analisi e nella catalogazione digitale di documenti storici.
  4. Istruzione: Sostenere la ricerca accademica e l'insegnamento nei campi della computer vision e dell'apprendimento automatico.

Come posso eseguire un'inferenza utilizzando un modello addestrato sul dataset Signature Detection?

Per eseguire l'inferenza utilizzando un modello addestrato sul dataset Signature Detection, segui i seguenti passaggi:

  1. Carica il tuo modello perfezionato.
  2. Usa il seguente script Python o il comando CLI per eseguire l'inferenza:

Esempio di inferenza

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Qual è la struttura del Dataset di rilevamento delle firme e dove posso trovare maggiori informazioni?

Il Dataset di rilevamento delle firme è diviso in due sottoinsiemi:

  • Set di allenamento: Contiene 143 immagini con annotazioni.
  • Set di convalida: Include 35 immagini con annotazioni.

Per informazioni dettagliate, puoi consultare la sezione Struttura del set di dati sezione. Inoltre, visualizza la configurazione completa del set di dati nella sezione signature.yaml che si trova all'indirizzo signature.yaml.



Creato 2024-05-22, Aggiornato 2024-07-04
Autori: glenn-jocher (2), RizwanMunawar (1)

Commenti