Saltar al contenido

Conjunto de datos de detecci贸n de firmas

Este conjunto de datos se centra en la detecci贸n de firmas humanas escritas en documentos. Incluye diversos tipos de documentos con firmas anotadas, lo que proporciona informaci贸n valiosa para aplicaciones de verificaci贸n de documentos y detecci贸n de fraudes. Esencial para entrenar algoritmos de visi贸n por ordenador, este conjunto de datos ayuda a identificar firmas en diversos formatos de documentos, apoyando la investigaci贸n y las aplicaciones pr谩cticas en el an谩lisis de documentos.

Estructura del conjunto de datos

El conjunto de datos de detecci贸n de firmas se divide en tres subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 im谩genes, cada una con sus correspondientes anotaciones.
  • Conjunto de validaci贸n: Incluye 35 im谩genes, cada una con anotaciones emparejadas.

Aplicaciones

Este conjunto de datos puede aplicarse en diversas tareas de visi贸n por ordenador, como la detecci贸n de objetos, el seguimiento de objetos y el an谩lisis de documentos. En concreto, puede utilizarse para entrenar y evaluar modelos de identificaci贸n de firmas en documentos, lo que puede tener aplicaciones en la verificaci贸n de documentos, la detecci贸n de fraudes y la investigaci贸n de archivos. Adem谩s, puede servir como valioso recurso con fines educativos, permitiendo a estudiantes e investigadores estudiar y comprender las caracter铆sticas y comportamientos de las firmas en distintos tipos de documentos.

Conjunto de datos YAML

Un archivo YAML (Yet Another Markup Language) define la configuraci贸n del conjunto de datos, incluyendo rutas e informaci贸n sobre clases. Para el conjunto de datos de detecci贸n de firmas, el archivo signature.yaml se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/firma.yaml

# Ultralytics YOLO 馃殌, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# 鈹溾攢鈹 ultralytics
# 鈹斺攢鈹 datasets
#     鈹斺攢鈹 signature  鈫 downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Utilizaci贸n

Para entrenar un modelo YOLOv8n en el conjunto de datos de detecci贸n de firmas para 100 茅pocas con un tama帽o de imagen de 640, utiliza los ejemplos de c贸digo proporcionados. Para obtener una lista completa de los par谩metros disponibles, consulta la p谩gina Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Ejemplos de im谩genes y anotaciones

El conjunto de datos de detecci贸n de firmas comprende una amplia variedad de im谩genes que muestran distintos tipos de documentos y firmas anotadas. A continuaci贸n se muestran ejemplos de im谩genes del conjunto de datos, cada una acompa帽ada de sus correspondientes anotaciones.

Imagen de muestra del conjunto de datos de detecci贸n de firmas

  • Imagen en mosaico: Aqu铆 presentamos un lote de entrenamiento formado por im谩genes del conjunto de datos en mosaico. El mosaico, una t茅cnica de entrenamiento, combina varias im谩genes en una, enriqueciendo la diversidad del lote. Este m茅todo ayuda a mejorar la capacidad del modelo para generalizar a trav茅s de diferentes tama帽os de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las im谩genes del Conjunto de Datos de Detecci贸n de Firmas, y pone de relieve las ventajas de incluir el mosaico durante el proceso de entrenamiento.

Citas y agradecimientos

El conjunto de datos se ha publicado bajo la LicenciaAGPL-3.0 .



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Comentarios