Ir al contenido

Conjunto de datos de detección de firmas

Este conjunto de datos se centra en la detección de firmas manuscritas dentro de documentos. Incluye una variedad de tipos de documentos con firmas anotadas, proporcionando información valiosa para aplicaciones en la verificación de documentos y la detección de fraudes. Esencial para el entrenamiento de algoritmos de visión artificial, este conjunto de datos ayuda a identificar firmas en varios formatos de documentos, apoyando la investigación y las aplicaciones prácticas en el análisis de documentos.

Estructura del conjunto de datos

El conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes, cada una con sus correspondientes anotaciones.
  • Conjunto de validación: Incluye 35 imágenes, cada una con anotaciones emparejadas.

Aplicaciones

Este conjunto de datos se puede aplicar en varias tareas de visión artificial, como la detección de objetos, el seguimiento de objetos y el análisis de documentos. Específicamente, se puede utilizar para entrenar y evaluar modelos para identificar firmas en documentos, lo que tiene aplicaciones significativas en:

  • Verificación de documentos: Automatización del proceso de verificación para documentos legales y financieros
  • Detección de fraude: Identificación de firmas potencialmente falsificadas o no autorizadas
  • Procesamiento Digital de Documentos: Agilización de los flujos de trabajo en los sectores administrativo y legal.
  • Banca y Finanzas: Mejora de la seguridad en el procesamiento de cheques y la verificación de documentos de préstamos
  • Investigación de archivo: Apoyo al análisis y catalogación de documentos históricos

Además, sirve como un recurso valioso para fines educativos, permitiendo a estudiantes e investigadores estudiar las características distintivas en diferentes tipos de documentos.

YAML del conjunto de datos

Un archivo YAML (Yet Another Markup Language) define la configuración del conjunto de datos, incluyendo las rutas y la información de las clases. Para el conjunto de datos de detección de firmas, el archivo es: signature.yaml el archivo se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Uso

Para entrenar un modelo YOLO11n en el conjunto de datos de detección de firmas durante 100 épocas con un tamaño de imagen de 640, utilice los ejemplos de código proporcionados. Para obtener una lista completa de los parámetros disponibles, consulte la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

sample_images y anotaciones

El conjunto de datos de detección de firmas comprende una amplia variedad de imágenes que muestran diferentes tipos de documentos y firmas anotadas. A continuación, se muestran ejemplos de imágenes del conjunto de datos, cada una acompañada de sus anotaciones correspondientes.

Imagen de muestra del conjunto de datos de detección de firmas

  • Imagen en mosaico: Aquí, presentamos un lote de entrenamiento que consta de imágenes de conjuntos de datos en mosaico. El mosaico, una técnica de entrenamiento, combina varias imágenes en una, enriqueciendo la diversidad del lote. Este método ayuda a mejorar la capacidad del modelo para generalizar en diferentes tamaños de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las imágenes en el conjunto de datos de detección de firmas, enfatizando los beneficios de incluir el mosaico durante el proceso de entrenamiento.

Citas y agradecimientos

El conjunto de datos se ha publicado y está disponible bajo la Licencia AGPL-3.0.

Preguntas frecuentes

¿Qué es el conjunto de datos Signature Detection Dataset y cómo se puede utilizar?

El conjunto de datos de Detección de Firmas es una colección de imágenes anotadas destinadas a detectar firmas humanas dentro de varios tipos de documentos. Se puede aplicar en tareas de visión artificial como la detección de objetos y el seguimiento, principalmente para la verificación de documentos, la detección de fraudes y la investigación de archivos. Este conjunto de datos ayuda a entrenar modelos para reconocer firmas en diferentes contextos, lo que lo hace valioso tanto para la investigación como para las aplicaciones prácticas en el análisis inteligente de documentos.

¿Cómo entreno un modelo YOLO11n en el conjunto de datos Signature Detection Dataset?

Para entrenar un modelo YOLO11n en el conjunto de datos Signature Detection, siga estos pasos:

  1. Descargue el signature.yaml archivo de configuración del conjunto de datos de signature.yaml.
  2. Utilice el siguiente script de python o comando CLI para iniciar el entrenamiento:

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Para obtener más detalles, consulte la página de Entrenamiento.

¿Cuáles son las principales aplicaciones del conjunto de datos Signature Detection Dataset?

El Conjunto de Datos de Detección de Firmas se puede utilizar para:

  1. Verificación de documentos: Verificación automática de la presencia y autenticidad de firmas humanas en documentos.
  2. Detección de fraude: Identificación de firmas falsificadas o fraudulentas en documentos legales y financieros.
  3. Investigación de archivo: Asistencia a historiadores y archivistas en el análisis digital y la catalogación de documentos históricos.
  4. Educación: Apoyo a la investigación académica y la enseñanza en los campos de la visión artificial y el aprendizaje automático.
  5. Servicios financieros: Mejora de la seguridad en las transacciones bancarias y el procesamiento de préstamos mediante la verificación de la autenticidad de la firma.

¿Cómo puedo realizar la inferencia utilizando un modelo entrenado en el conjunto de datos Signature Detection Dataset?

Para realizar la inferencia utilizando un modelo entrenado en el Conjunto de Datos de Detección de Firmas, sigue estos pasos:

  1. Cargue su modelo ajustado.
  2. Utilice el siguiente script de python o comando de la CLI para realizar la inferencia:

Ejemplo de inferencia

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

¿Cuál es la estructura del conjunto de datos Signature Detection Dataset y dónde puedo encontrar más información?

El conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes con anotaciones.
  • Conjunto de validación: Incluye 35 imágenes con anotaciones.

Para obtener información detallada, puede consultar la Estructura del conjunto de datos sección. Además, vea la configuración completa del conjunto de datos en el signature.yaml archivo ubicado en signature.yaml.



📅 Creado hace 1 año ✏️ Actualizado hace 5 meses

Comentarios