Signature Detection Dataset
Questo dataset si concentra sul rilevamento di firme manoscritte all'interno di documenti. Include una varietà di tipi di documenti con firme annotate, fornendo preziose informazioni per applicazioni nella verifica dei documenti e nel rilevamento delle frodi. Essenziale per l'addestramento di algoritmi di computer vision, questo dataset aiuta a identificare le firme in vari formati di documenti, supportando la ricerca e le applicazioni pratiche nell'analisi dei documenti.
Struttura del set di dati
Il dataset di rilevamento firme è suddiviso in due sottoinsiemi:
- Set di addestramento: Contiene 143 immagini, ciascuna con le relative annotazioni.
- Set di convalida: Include 35 immagini, ciascuna con annotazioni abbinate.
Applicazioni
Questo dataset può essere applicato in vari compiti di computer vision come object detection, object tracking e analisi di documenti. Nello specifico, può essere utilizzato per addestrare e valutare modelli per l'identificazione di firme nei documenti, il che ha applicazioni significative in:
- Verifica dei documenti: Automatizzazione del processo di verifica per documenti legali e finanziari
- Rilevamento frodi: Identificazione di firme potenzialmente false o non autorizzate
- Digital Document Processing: Semplificazione dei flussi di lavoro nei settori amministrativi e legali
- Settore Bancario e Finanziario: Miglioramento della sicurezza nell'elaborazione di assegni e nella verifica di documenti di prestito
- Ricerca d'archivio: Supporto per l'analisi e la catalogazione di documenti storici
Inoltre, funge da risorsa preziosa per scopi didattici, consentendo a studenti e ricercatori di studiare le caratteristiche distintive tra diversi tipi di documenti.
YAML del set di dati
Un file YAML (Yet Another Markup Language) definisce la configurazione del dataset, incluse le informazioni sui percorsi e le classi. Per il dataset di rilevamento delle firme, il signature.yaml
il file si trova in https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
Utilizzo
Per addestrare un modello YOLO11n sul dataset di rilevamento delle firme per 100 epoche con una dimensione dell'immagine di 640, utilizzare gli esempi di codice forniti. Per un elenco completo dei parametri disponibili, fare riferimento alla pagina Addestramento del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640
Esempio di inferenza
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75
Immagini di esempio e annotazioni
Il dataset di rilevamento delle firme comprende un'ampia varietà di immagini che mostrano diversi tipi di documenti e firme annotate. Di seguito sono riportati esempi di immagini del dataset, ciascuna accompagnata dalle relative annotazioni.
- Immagine Mosaicata: Qui presentiamo un batch di addestramento composto da immagini del dataset mosaicato. Il mosaicing, una tecnica di addestramento, combina più immagini in una sola, arricchendo la diversità del batch. Questo metodo aiuta a migliorare la capacità del modello di generalizzare tra diverse dimensioni di firma, proporzioni e contesti.
Questo esempio illustra la varietà e la complessità delle immagini nel Signature Detection Dataset, sottolineando i vantaggi dell'inclusione del mosaicing durante il processo di addestramento.
Citazioni e ringraziamenti
Il dataset è stato rilasciato con la licenza AGPL-3.0.
FAQ
Cos'è il Signature Detection Dataset e come può essere utilizzato?
Il dataset di rilevamento firme è una raccolta di immagini annotate volte a rilevare firme umane all'interno di vari tipi di documenti. Può essere applicato in attività di visione artificiale come il rilevamento di oggetti e il tracciamento, principalmente per la verifica dei documenti, il rilevamento di frodi e la ricerca archivistica. Questo dataset aiuta a formare modelli per riconoscere le firme in diversi contesti, rendendolo prezioso sia per la ricerca che per le applicazioni pratiche nell'analisi intelligente dei documenti.
Come posso addestrare un modello YOLO11n sul Signature Detection Dataset?
Per addestrare un modello YOLO11n sul Signature Detection Dataset, segui questi passaggi:
- Scarica il
signature.yaml
file di configurazione del dataset da signature.yaml. - Utilizza il seguente script python o comando CLI per avviare il training:
Esempio di addestramento
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640
Per maggiori dettagli, consulta la pagina di Training.
Quali sono le principali applicazioni del Signature Detection Dataset?
Il Signature Detection Dataset può essere utilizzato per:
- Verifica dei documenti: Verifica automatica della presenza e dell'autenticità delle firme umane nei documenti.
- Rilevamento di frodi: Identificazione di firme false o fraudolente in documenti legali e finanziari.
- Ricerca archivistica: Supporto a storici e archivisti nell'analisi digitale e nella catalogazione di documenti storici.
- Istruzione: Supporto alla ricerca accademica e all'insegnamento nei campi della visione artificiale e dell'apprendimento automatico.
- Servizi finanziari: Miglioramento della sicurezza nelle transazioni bancarie e nell'elaborazione dei prestiti attraverso la verifica dell'autenticità delle firme.
Come posso eseguire l'inferenza utilizzando un modello addestrato sul Signature Detection Dataset?
Per eseguire l'inferenza utilizzando un modello addestrato sul Signature Detection Dataset, segui questi passaggi:
- Carica il tuo modello ottimizzato.
- Utilizzare lo script Python o il comando CLI riportato di seguito per eseguire l'inferenza:
Esempio di inferenza
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75
Qual è la struttura del Signature Detection Dataset e dove posso trovare maggiori informazioni?
Il Signature Detection Dataset è diviso in due sottoinsiemi:
- Training Set: Contiene 143 immagini con annotazioni.
- Validation Set: Include 35 immagini con annotazioni.
Per informazioni dettagliate, puoi consultare la Struttura del set di dati sezione. Inoltre, visualizza la configurazione completa del dataset nel signature.yaml
file situato in signature.yaml.