Saltar al contenido

Conjunto de datos de detección de firmas

Este conjunto de datos se centra en la detección de firmas humanas escritas en documentos. Incluye diversos tipos de documentos con firmas anotadas, lo que proporciona información valiosa para aplicaciones de verificación de documentos y detección de fraudes. Esencial para entrenar algoritmos de visión por ordenador, este conjunto de datos ayuda a identificar firmas en diversos formatos de documentos, apoyando la investigación y las aplicaciones prácticas en el análisis de documentos.

Estructura del conjunto de datos

El conjunto de datos de detección de firmas se divide en tres subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes, cada una con sus correspondientes anotaciones.
  • Conjunto de validación: Incluye 35 imágenes, cada una con anotaciones emparejadas.

Aplicaciones

Este conjunto de datos puede aplicarse en diversas tareas de visión por ordenador, como la detección de objetos, el seguimiento de objetos y el análisis de documentos. En concreto, puede utilizarse para entrenar y evaluar modelos de identificación de firmas en documentos, lo que puede tener aplicaciones en la verificación de documentos, la detección de fraudes y la investigación de archivos. Además, puede servir como valioso recurso con fines educativos, permitiendo a estudiantes e investigadores estudiar y comprender las características y comportamientos de las firmas en distintos tipos de documentos.

Conjunto de datos YAML

Un archivo YAML (Yet Another Markup Language) define la configuración del conjunto de datos, incluyendo rutas e información sobre clases. Para el conjunto de datos de detección de firmas, el archivo signature.yaml se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/firma.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Utilización

Para entrenar un modelo YOLOv8n en el conjunto de datos de detección de firmas para 100 épocas con un tamaño de imagen de 640, utiliza los ejemplos de código proporcionados. Para obtener una lista completa de los parámetros disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Ejemplos de imágenes y anotaciones

El conjunto de datos de detección de firmas comprende una amplia variedad de imágenes que muestran distintos tipos de documentos y firmas anotadas. A continuación se muestran ejemplos de imágenes del conjunto de datos, cada una acompañada de sus correspondientes anotaciones.

Imagen de muestra del conjunto de datos de detección de firmas

  • Imagen en mosaico: Aquí presentamos un lote de entrenamiento formado por imágenes del conjunto de datos en mosaico. El mosaico, una técnica de entrenamiento, combina varias imágenes en una, enriqueciendo la diversidad del lote. Este método ayuda a mejorar la capacidad del modelo para generalizar a través de diferentes tamaños de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las imágenes del Conjunto de Datos de Detección de Firmas, y pone de relieve las ventajas de incluir el mosaico durante el proceso de entrenamiento.

Citas y agradecimientos

El conjunto de datos se ha publicado bajo la LicenciaAGPL-3.0 .



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Comentarios