Ir al contenido

Conjunto de datos de detección de firmas

Este conjunto de datos se centra en la detección de firmas humanas escritas en documentos. Incluye diversos tipos de documentos con firmas anotadas, lo que proporciona información valiosa para aplicaciones de verificación de documentos y detección de fraudes. Esencial para el entrenamiento de algoritmos de visión por ordenador, este conjunto de datos ayuda a identificar firmas en diversos formatos de documentos, apoyando la investigación y las aplicaciones prácticas en el análisis de documentos.

Estructura del conjunto de datos

El conjunto de datos de detección de firmas se divide en tres subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes, cada una con sus correspondientes anotaciones.
  • Conjunto de validación: Incluye 35 imágenes, cada una con anotaciones emparejadas.

Aplicaciones

Este conjunto de datos puede aplicarse a diversas tareas de visión por ordenador, como la detección de objetos, el seguimiento de objetos y el análisis de documentos. En concreto, puede utilizarse para entrenar y evaluar modelos de identificación de firmas en documentos, lo que puede tener aplicaciones en la verificación de documentos, la detección de fraudes y la investigación de archivos. Además, puede servir como valioso recurso para fines educativos, permitiendo a estudiantes e investigadores estudiar y comprender las características y comportamientos de las firmas en distintos tipos de documentos.

Conjunto de datos YAML

Un archivo YAML (Yet Another Markup Language) define la configuración del conjunto de datos, incluidas las rutas y la información sobre las clases. Para el conjunto de datos de detección de firmas, el archivo signature.yaml se encuentra en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/firma.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilización

Para entrenar un modelo YOLO11n en el conjunto de datos de detección de firmas para 100 épocas con un tamaño de imagen de 640, utilice los ejemplos de código proporcionados. Para obtener una lista completa de los parámetros disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Ejemplo de inferencia

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Ejemplos de imágenes y anotaciones

El conjunto de datos de detección de firmas comprende una amplia variedad de imágenes que muestran distintos tipos de documentos y firmas anotadas. A continuación se muestran ejemplos de imágenes del conjunto de datos, cada una de ellas acompañada de sus correspondientes anotaciones.

Imagen de muestra del conjunto de datos de detección de firmas

  • Imagen en mosaico: Presentamos un lote de entrenamiento compuesto por imágenes de un conjunto de datos en mosaico. El mosaico, una técnica de entrenamiento, combina varias imágenes en una, enriqueciendo la diversidad del lote. Este método ayuda a mejorar la capacidad del modelo para generalizar a través de diferentes tamaños de firma, relaciones de aspecto y contextos.

Este ejemplo ilustra la variedad y complejidad de las imágenes del conjunto de datos de detección de firmas, y pone de relieve las ventajas de incluir la creación de mosaicos durante el proceso de entrenamiento.

Citas y agradecimientos

El conjunto de datos se ha publicado bajo la licenciaAGPL-3.0 .

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos de detección de firmas y cómo puede utilizarse?

El conjunto de datos de detección de firmas es una colección de imágenes con anotaciones destinadas a detectar firmas humanas en diversos tipos de documentos. Puede aplicarse a tareas de visión por ordenador como la detección y el seguimiento de objetos, principalmente para la verificación de documentos, la detección de fraudes y la investigación de archivos. Este conjunto de datos ayuda a entrenar modelos para reconocer firmas en diferentes contextos, lo que lo hace valioso tanto para la investigación como para aplicaciones prácticas.

¿Cómo entreno un modelo YOLO11n en el conjunto de datos de detección de firmas?

Para entrenar un modelo YOLO11n en el conjunto de datos de detección de firmas, siga estos pasos:

  1. Descargar el signature.yaml archivo de configuración del conjunto de datos de firma.yaml.
  2. Utilice el siguiente script Python o el comando CLI para iniciar el entrenamiento:

Ejemplo de tren

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Para más detalles, consulte la página de Formación.

¿Cuáles son las principales aplicaciones del conjunto de datos de detección de firmas?

El conjunto de datos de detección de firmas puede utilizarse para:

  1. Verificación de documentos: Verificación automática de la presencia y autenticidad de firmas humanas en documentos.
  2. Detección de fraudes: Identificación de firmas falsificadas o fraudulentas en documentos jurídicos y financieros.
  3. Investigación archivística: Asistencia a historiadores y archiveros en el análisis digital y la catalogación de documentos históricos.
  4. Educación: Apoyo a la investigación académica y la docencia en los campos de la visión por ordenador y el aprendizaje automático.

¿Cómo puedo realizar inferencias utilizando un modelo entrenado en el conjunto de datos de detección de firmas?

Para realizar inferencias utilizando un modelo entrenado en el conjunto de datos de detección de firmas, siga estos pasos:

  1. Carga tu modelo afinado.
  2. Utilice el siguiente script Python o el comando CLI para realizar la inferencia:

Ejemplo de inferencia

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

¿Cuál es la estructura del conjunto de datos de detección de firmas y dónde puedo encontrar más información?

El conjunto de datos de detección de firmas se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Contiene 143 imágenes con anotaciones.
  • Conjunto de validación: Incluye 35 imágenes con anotaciones.

Para obtener información detallada, puede consultar el Estructura del conjunto de datos sección. Además, vea la configuración completa del conjunto de datos en la sección signature.yaml situado en firma.yaml.

📅 Created 7 months ago ✏️ Updated 3 months ago

Comentarios