Conjunto de Dados de Detecção de Assinaturas

Este conjunto de dados foca na detecção de assinaturas humanas escritas em documentos. Inclui uma variedade de tipos de documentos com assinaturas anotadas, fornecendo insights valiosos para aplicações em verificação de documentos e detecção de fraudes. Essencial para treinar algoritmos de visão computacional, este conjunto de dados auxilia na identificação de assinaturas em diversos formatos de documentos, apoiando pesquisas e aplicações práticas em análise de documentos.

Estrutura do Dataset

O conjunto de dados de detecção de assinaturas está dividido em dois subconjuntos:

  • Conjunto de treinamento: Contém 143 imagens, cada uma com as respectivas anotações.
  • Conjunto de validação: Inclui 35 imagens, cada uma com anotações pareadas.

Aplicações

Este conjunto de dados pode ser aplicado em várias tarefas de visão computacional, como detecção de objetos, rastreamento de objetos e análise de documentos. Especificamente, pode ser usado para treinar e avaliar modelos para identificar assinaturas em documentos, o que tem aplicações significativas em:

  • Verificação de Documentos: Automatização do processo de verificação para documentos legais e financeiros
  • Detecção de Fraudes: Identificação de assinaturas potencialmente falsificadas ou não autorizadas
  • Processamento de Documentos Digitais: Simplificação de fluxos de trabalho em setores administrativos e jurídicos
  • Bancário e Financeiro: Melhoria da segurança no processamento de cheques e verificação de documentos de empréstimos
  • Pesquisa Arquivística: Apoio à análise e catalogação de documentos históricos

Além disso, serve como um recurso valioso para fins educacionais, permitindo que estudantes e pesquisadores estudem as características das assinaturas em diferentes tipos de documentos.

YAML do Dataset

Um arquivo YAML (Yet Another Markup Language) define a configuração do conjunto de dados, incluindo caminhos e informações das classes. Para o conjunto de dados de detecção de assinaturas, o arquivo signature.yaml está localizado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilização

Para treinar um modelo YOLO26n no conjunto de dados de detecção de assinaturas por 100 épocas com um tamanho de imagem de 640, use os exemplos de código fornecidos. Para uma lista abrangente de parâmetros disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
Exemplo de Inferência
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Amostra de Imagens e Anotações

O conjunto de dados de detecção de assinaturas compreende uma grande variedade de imagens que exibem diferentes tipos de documentos e assinaturas anotadas. Abaixo estão exemplos de imagens do conjunto de dados, cada uma acompanhada por suas anotações correspondentes.

Imagem de amostra do conjunto de dados de detecção de assinaturas

  • Imagem em Mosaico: Aqui, apresentamos um lote de treinamento que consiste em imagens em mosaico do conjunto de dados. A mosaicagem, uma técnica de treinamento, combina várias imagens em uma só, enriquecendo a diversidade do lote. Este método ajuda a melhorar a capacidade do modelo de generalizar através de diferentes tamanhos de assinatura, proporções e contextos.

Este exemplo ilustra a variedade e complexidade das imagens no conjunto de dados de Detecção de Assinaturas, enfatizando os benefícios de incluir a mosaicagem durante o processo de treinamento.

Citações e Agradecimentos

O conjunto de dados foi lançado sob a Licença AGPL-3.0.

FAQ

O que é o Conjunto de Dados de Detecção de Assinaturas e como ele pode ser usado?

O Conjunto de Dados de Detecção de Assinaturas é uma coleção de imagens anotadas com o objetivo de detectar assinaturas humanas em vários tipos de documentos. Pode ser aplicado em tarefas de visão computacional como detecção de objetos e rastreamento, principalmente para verificação de documentos, detecção de fraudes e pesquisa arquivística. Este conjunto de dados ajuda a treinar modelos para reconhecer assinaturas em diferentes contextos, tornando-o valioso tanto para pesquisas quanto para aplicações práticas em análise inteligente de documentos.

Como treino um modelo YOLO26n no Conjunto de Dados de Detecção de Assinaturas?

Para treinar um modelo YOLO26n no Conjunto de Dados de Detecção de Assinaturas, siga estas etapas:

  1. Baixe o arquivo de configuração do conjunto de dados signature.yaml em signature.yaml.
  2. Use o seguinte script Python ou comando CLI para iniciar o treinamento:
Exemplo de Treino
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Para mais detalhes, consulte a página de Treinamento.

Quais são as principais aplicações do Conjunto de Dados de Detecção de Assinaturas?

O Conjunto de Dados de Detecção de Assinaturas pode ser usado para:

  1. Verificação de Documentos: Verificação automática da presença e autenticidade de assinaturas humanas em documentos.
  2. Detecção de Fraudes: Identificação de assinaturas falsificadas ou fraudulentas em documentos legais e financeiros.
  3. Pesquisa Arquivística: Auxílio a historiadores e arquivistas na análise digital e catalogação de documentos históricos.
  4. Educação: Apoio à pesquisa acadêmica e ao ensino nas áreas de visão computacional e aprendizado de máquina.
  5. Serviços Financeiros: Melhoria da segurança em transações bancárias e processamento de empréstimos ao verificar a autenticidade das assinaturas.

Como posso realizar inferência usando um modelo treinado no Conjunto de Dados de Detecção de Assinaturas?

Para realizar inferência usando um modelo treinado no Conjunto de Dados de Detecção de Assinaturas, siga estas etapas:

  1. Carregue seu modelo ajustado.
  2. Use o script Python ou comando CLI abaixo para realizar a inferência:
Exemplo de Inferência
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Qual é a estrutura do Conjunto de Dados de Detecção de Assinaturas e onde posso encontrar mais informações?

O Conjunto de Dados de Detecção de Assinaturas é dividido em dois subconjuntos:

  • Conjunto de Treinamento: Contém 143 imagens com anotações.
  • Conjunto de Validação: Inclui 35 imagens com anotações.

Para informações detalhadas, você pode consultar a seção Estrutura do Conjunto de Dados. Além disso, veja a configuração completa do conjunto de dados no arquivo signature.yaml localizado em signature.yaml.

Comentários