Conjunto de datos de detección de firmas

Este conjunto de datos se centra en la detección de firmas manuscritas en documentos. Incluye una variedad de tipos de documentos con firmas anotadas, proporcionando información valiosa para aplicaciones de verificación de documentos y detección de fraudes. Esencial para entrenar algoritmos de computer vision, este conjunto de datos ayuda a identificar firmas en diversos formatos de documentos, apoyando la investigación y las aplicaciones prácticas en el análisis de documentos.

Estructura del conjunto de datos

El conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes, cada una con sus correspondientes anotaciones.
  • Conjunto de validación: Incluye 35 imágenes, cada una con sus anotaciones emparejadas.

Aplicaciones

Este conjunto de datos puede aplicarse en diversas tareas de computer vision como object detection, object tracking y análisis de documentos. Específicamente, puede utilizarse para entrenar y evaluar modelos para identificar firmas en documentos, lo que tiene aplicaciones significativas en:

  • Verificación de documentos: Automatización del proceso de verificación para documentos legales y financieros
  • Detección de fraudes: Identificación de firmas potencialmente falsificadas o no autorizadas
  • Procesamiento de documentos digitales: Agilización de flujos de trabajo en los sectores administrativo y legal
  • Banca y finanzas: Mejora de la seguridad en el procesamiento de cheques y la verificación de documentos de préstamos
  • Investigación archivística: Apoyo al análisis y catalogación de documentos históricos

Además, sirve como un recurso valioso para fines educativos, permitiendo a estudiantes e investigadores estudiar las características de las firmas en diferentes tipos de documentos.

YAML del conjunto de datos

Un archivo YAML (Yet Another Markup Language) define la configuración del conjunto de datos, incluyendo la información de rutas y clases. Para el conjunto de datos de detección de firmas, el archivo signature.yaml se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Uso

Para entrenar un modelo YOLO26n en el conjunto de datos de detección de firmas durante 100 epochs con un tamaño de imagen de 640, utiliza los ejemplos de código proporcionados. Para obtener una lista completa de los parámetros disponibles, consulta la página de Training del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
Ejemplo de inferencia
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Imágenes y anotaciones de muestra

El conjunto de datos de detección de firmas comprende una amplia variedad de imágenes que muestran diferentes tipos de documentos y firmas anotadas. A continuación, se presentan ejemplos de imágenes del conjunto de datos, cada una acompañada de sus correspondientes anotaciones.

Imagen de muestra del conjunto de datos de detección de firmas

  • Imagen en mosaico: Aquí presentamos un lote de entrenamiento que consiste en imágenes del conjunto de datos en mosaico. El mosaico, una técnica de entrenamiento, combina varias imágenes en una sola, enriqueciendo la diversidad del lote. Este método ayuda a mejorar la capacidad del modelo para generalizar entre diferentes tamaños de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las imágenes en el conjunto de datos de detección de firmas, enfatizando los beneficios de incluir el mosaico durante el proceso de entrenamiento.

Citas y reconocimientos

El conjunto de datos ha sido publicado bajo la AGPL-3.0 License.

Preguntas frecuentes

¿Qué es el conjunto de datos de detección de firmas y cómo se puede utilizar?

El conjunto de datos de detección de firmas es una colección de imágenes anotadas destinadas a detectar firmas humanas dentro de varios tipos de documentos. Puede aplicarse en tareas de computer vision como object detection y seguimiento, principalmente para la verificación de documentos, detección de fraudes e investigación archivística. Este conjunto de datos ayuda a entrenar modelos para reconocer firmas en diferentes contextos, lo que lo hace valioso tanto para la investigación como para aplicaciones prácticas en smart document analysis.

¿Cómo entreno un modelo YOLO26n con el conjunto de datos de detección de firmas?

Para entrenar un modelo YOLO26n con el conjunto de datos de detección de firmas, sigue estos pasos:

  1. Descarga el archivo de configuración del conjunto de datos signature.yaml desde signature.yaml.
  2. Usa el siguiente script de Python o comando de CLI para iniciar el entrenamiento:
Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Para obtener más detalles, consulta la página de Training.

¿Cuáles son las principales aplicaciones del conjunto de datos de detección de firmas?

El conjunto de datos de detección de firmas se puede utilizar para:

  1. Verificación de documentos: Verificar automáticamente la presencia y autenticidad de firmas humanas en los documentos.
  2. Detección de fraudes: Identificar firmas falsificadas o fraudulentas en documentos legales y financieros.
  3. Investigación archivística: Ayudar a historiadores y archivistas en el análisis digital y catalogación de documentos históricos.
  4. Educación: Apoyar la investigación académica y la enseñanza en los campos de computer vision y machine learning.
  5. Servicios financieros: Mejorar la seguridad en transacciones bancarias y procesamiento de préstamos verificando la autenticidad de las firmas.

¿Cómo puedo realizar una inferencia usando un modelo entrenado con el conjunto de datos de detección de firmas?

Para realizar una inferencia usando un modelo entrenado con el conjunto de datos de detección de firmas, sigue estos pasos:

  1. Carga tu modelo ajustado.
  2. Usa el siguiente script de Python o comando de CLI para realizar la inferencia:
Ejemplo de inferencia
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

¿Cuál es la estructura del conjunto de datos de detección de firmas y dónde puedo encontrar más información?

El conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes con anotaciones.
  • Conjunto de validación: Incluye 35 imágenes con anotaciones.

Para obtener información detallada, puedes consultar la sección Dataset Structure. Además, revisa la configuración completa del conjunto de datos en el archivo signature.yaml ubicado en signature.yaml.

Comentarios