Vai al contenuto

Set di dati per il rilevamento delle firme

Questo set di dati si concentra sul rilevamento di firme scritte dall'uomo all'interno dei documenti. Include una varietĂ  di tipi di documenti con firme annotate, fornendo preziose informazioni per applicazioni nella verifica dei documenti e nel rilevamento delle frodi. Essenziale per l'addestramento degli algoritmi di computer vision, questo set di dati aiuta a identificare le firme in vari formati di documenti, supportando la ricerca e le applicazioni pratiche nell'analisi dei documenti.

Struttura del set di dati

Il set di dati per il rilevamento delle firme è suddiviso in tre sottoinsiemi:

  • Set di allenamento: Contiene 143 immagini, ciascuna con le relative annotazioni.
  • Set di convalida: Include 35 immagini, ciascuna con annotazioni accoppiate.

Applicazioni

Questo set di dati può essere applicato a diverse attività di computer vision, come il rilevamento di oggetti, il tracciamento di oggetti e l'analisi di documenti. In particolare, può essere utilizzato per addestrare e valutare modelli per l'identificazione delle firme nei documenti, che possono trovare applicazione nella verifica dei documenti, nel rilevamento delle frodi e nella ricerca archivistica. Inoltre, può servire come risorsa preziosa per scopi didattici, consentendo a studenti e ricercatori di studiare e comprendere le caratteristiche e i comportamenti delle firme in diversi tipi di documenti.

Set di dati YAML

Un file YAML (Yet Another Markup Language) definisce la configurazione del dataset, compresi i percorsi e le informazioni sulle classi. Per il set di dati sul rilevamento delle firme, il file signature.yaml Il file si trova all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilizzo

Per addestrare un modello YOLO11n sul dataset di rilevamento delle firme per 100 epoche con una dimensione dell'immagine di 640, utilizzare gli esempi di codice forniti. Per un elenco completo dei parametri disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Esempio di inferenza

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Immagini di esempio e annotazioni

Il set di dati per il rilevamento delle firme comprende un'ampia varietĂ  di immagini che mostrano diversi tipi di documenti e firme annotate. Di seguito sono riportati alcuni esempi di immagini tratte dal set di dati, ciascuna accompagnata dalle relative annotazioni.

Immagine campione del set di dati per il rilevamento della firma

  • Immagine mosaicata: Qui presentiamo un batch di formazione costituito da immagini del dataset mosaicate. La mosaicatura, una tecnica di formazione, combina piĂš immagini in una sola, arricchendo la diversitĂ  del batch. Questo metodo contribuisce a migliorare la capacitĂ  del modello di generalizzarsi a diverse dimensioni di firma, rapporti di aspetto e contesti.

Questo esempio illustra la varietĂ  e la complessitĂ  delle immagini presenti nel Dataset di rilevamento delle firme, sottolineando i vantaggi dell'inclusione della mosaicatura durante il processo di addestramento.

Citazioni e ringraziamenti

Il set di dati è stato rilasciato sotto la licenzaAGPL-3.0 .

FAQ

Che cos'è il dataset Signature Detection e come può essere utilizzato?

Il Dataset Signature Detection è una raccolta di immagini annotate per il rilevamento di firme umane all'interno di vari tipi di documenti. Può essere applicato a compiti di computer vision come il rilevamento e il tracciamento di oggetti, principalmente per la verifica di documenti, il rilevamento di frodi e la ricerca archivistica. Questo set di dati aiuta ad addestrare i modelli a riconoscere le firme in diversi contesti, rendendolo prezioso sia per la ricerca che per le applicazioni pratiche.

Come si addestra un modello YOLO11n sul dataset Signature Detection?

Per addestrare un modello YOLO11n sul dataset Signature Detection, procedere come segue:

  1. Scarica il signature.yaml file di configurazione del set di dati da firma.yaml.
  2. Utilizzare il seguente script Python o il comando CLI per avviare la formazione:

Esempio di treno

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Per maggiori dettagli, consultare la pagina Formazione.

Quali sono le principali applicazioni del Dataset Signature Detection?

Il Dataset per il rilevamento delle firme può essere utilizzato per:

  1. Verifica dei documenti: Verifica automatica della presenza e dell'autenticitĂ  delle firme umane nei documenti.
  2. Rilevamento delle frodi: Identificazione di firme false o fraudolente in documenti legali e finanziari.
  3. Ricerca archivistica: Assistenza a storici e archivisti nell'analisi e nella catalogazione digitale di documenti storici.
  4. Istruzione: Sostenere la ricerca accademica e l'insegnamento nei campi della computer vision e dell'apprendimento automatico.

Come si può eseguire l'inferenza utilizzando un modello addestrato sul dataset Signature Detection?

Per eseguire l'inferenza utilizzando un modello addestrato sul dataset Signature Detection, procedere come segue:

  1. Caricare il modello perfezionato.
  2. Per eseguire l'inferenza, utilizzare il seguente script Python o il comando CLI :

Esempio di inferenza

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Qual è la struttura del Dataset Signature Detection e dove posso trovare maggiori informazioni?

Il dataset Signature Detection è suddiviso in due sottoinsiemi:

  • Set di allenamento: Contiene 143 immagini con annotazioni.
  • Set di convalida: Include 35 immagini con annotazioni.

Per informazioni dettagliate, è possibile consultare il documento Struttura del set di dati sezione. Inoltre, è possibile visualizzare la configurazione completa del set di dati nella sezione signature.yaml che si trova all'indirizzo firma.yaml.

📅C reato 6 mesi fa ✏️ Aggiornato 2 mesi fa

Commenti