Saltar al contenido

Conjunto de datos de detección de firmas

This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.

Estructura del conjunto de datos

El conjunto de datos de detección de firmas se divide en tres subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes, cada una con sus correspondientes anotaciones.
  • Conjunto de validación: Incluye 35 imágenes, cada una con anotaciones emparejadas.

Aplicaciones

Este conjunto de datos puede aplicarse en diversas tareas de visión por ordenador, como la detección de objetos, el seguimiento de objetos y el análisis de documentos. En concreto, puede utilizarse para entrenar y evaluar modelos de identificación de firmas en documentos, lo que puede tener aplicaciones en la verificación de documentos, la detección de fraudes y la investigación de archivos. Además, puede servir como valioso recurso con fines educativos, permitiendo a estudiantes e investigadores estudiar y comprender las características y comportamientos de las firmas en distintos tipos de documentos.

Conjunto de datos YAML

Un archivo YAML (Yet Another Markup Language) define la configuración del conjunto de datos, incluyendo rutas e información sobre clases. Para el conjunto de datos de detección de firmas, el archivo signature.yaml se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/firma.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilización

To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Ejemplos de imágenes y anotaciones

El conjunto de datos de detección de firmas comprende una amplia variedad de imágenes que muestran distintos tipos de documentos y firmas anotadas. A continuación se muestran ejemplos de imágenes del conjunto de datos, cada una acompañada de sus correspondientes anotaciones.

Imagen de muestra del conjunto de datos de detección de firmas

  • Imagen en mosaico: Aquí presentamos un lote de entrenamiento formado por imágenes del conjunto de datos en mosaico. El mosaico, una técnica de entrenamiento, combina varias imágenes en una, enriqueciendo la diversidad del lote. Este método ayuda a mejorar la capacidad del modelo para generalizar a través de diferentes tamaños de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las imágenes del Conjunto de Datos de Detección de Firmas, y pone de relieve las ventajas de incluir el mosaico durante el proceso de entrenamiento.

Citas y agradecimientos

El conjunto de datos se ha publicado bajo la LicenciaAGPL-3.0 .

PREGUNTAS FRECUENTES

¿Qué es el Conjunto de Datos de Detección de Firmas y cómo puede utilizarse?

The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.

How do I train a YOLO11n model on the Signature Detection Dataset?

To train a YOLO11n model on the Signature Detection Dataset, follow these steps:

  1. Descarga el signature.yaml archivo de configuración del conjunto de datos de firma.yaml.
  2. Utiliza el siguiente script Python o el comando CLI para iniciar el entrenamiento:

Ejemplo de tren

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Para más detalles, consulta la página de Formación.

¿Cuáles son las principales aplicaciones del Conjunto de Datos de Detección de Firmas?

El Conjunto de Datos de Detección de Firmas puede utilizarse para:

  1. Verificación de documentos: Verificar automáticamente la presencia y autenticidad de firmas humanas en documentos.
  2. Detección de fraudes: Identificación de firmas falsificadas o fraudulentas en documentos legales y financieros.
  3. Investigación archivística: Asistencia a historiadores y archiveros en el análisis digital y la catalogación de documentos históricos.
  4. Education: Supporting academic research and teaching in the fields of computer vision and machine learning.

¿Cómo puedo realizar inferencias utilizando un modelo entrenado en el Conjunto de Datos de Detección de Firmas?

Para realizar inferencias utilizando un modelo entrenado en el Conjunto de Datos de Detección de Firmas, sigue estos pasos:

  1. Carga tu modelo afinado.
  2. Utiliza el siguiente script Python o el comando CLI para realizar la inferencia:

Ejemplo de inferencia

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

¿Cuál es la estructura del Conjunto de Datos de Detección de Firmas y dónde puedo encontrar más información?

El Conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes con anotaciones.
  • Conjunto de validación: Incluye 35 imágenes con anotaciones.

Para obtener información detallada, puedes consultar el Estructura del conjunto de datos sección. Además, consulta la configuración completa del conjunto de datos en la sección signature.yaml archivo ubicado en firma.yaml.


📅 Created 4 months ago ✏️ Updated 6 days ago

Comentarios