Saltar para o conteúdo

Conjunto de dados de deteção de assinaturas

Este conjunto de dados centra-se na deteção de assinaturas humanas escritas em documentos. Inclui uma variedade de tipos de documentos com assinaturas anotadas, fornecendo informações valiosas para aplicações na verificação de documentos e deteção de fraudes. Essencial para o treino de algoritmos de visão por computador, este conjunto de dados ajuda a identificar assinaturas em vários formatos de documentos, apoiando a investigação e aplicações práticas na análise de documentos.

Estrutura do conjunto de dados

O conjunto de dados de deteção de assinaturas está dividido em dois subconjuntos:

  • Conjunto de treino: Contém 143 imagens, cada uma com anotações correspondentes.
  • Conjunto de validação: Inclui 35 imagens, cada uma com anotações emparelhadas.

Aplicações

Este conjunto de dados pode ser aplicado em várias tarefas de visão computacional, como a deteção de objectos, o seguimento de objectos e a análise de documentos. Especificamente, pode ser utilizado para treinar e avaliar modelos para identificar assinaturas em documentos, o que tem aplicações significativas em:

  • Verificação de documentos: Automatização do processo de verificação de documentos legais e financeiros
  • Deteção de fraudes: Identificação de assinaturas potencialmente falsificadas ou não autorizadas
  • Processamento digital de documentos: Simplificação dos fluxos de trabalho nos sectores administrativo e jurídico
  • Banca e finanças: Reforço da segurança no processamento de cheques e na verificação de documentos de empréstimos
  • Investigação arquivística: Apoio à análise e catalogação de documentos históricos

Além disso, serve como um recurso valioso para fins educativos, permitindo aos estudantes e investigadores estudar as caraterísticas das assinaturas em diferentes tipos de documentos.

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) define a configuração do conjunto de dados, incluindo caminhos e informações sobre classes. Para o conjunto de dados de deteção de assinatura, o arquivo signature.yaml O ficheiro está localizado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilização

Para treinar um modelo YOLO11n no conjunto de dados de deteção de assinaturas para 100 épocas com um tamanho de imagem de 640, utilize os exemplos de código fornecidos. Para obter uma lista completa dos parâmetros disponíveis, consulte a página de treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemplo de inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Exemplos de imagens e anotações

O conjunto de dados de deteção de assinaturas inclui uma grande variedade de imagens que mostram diferentes tipos de documentos e assinaturas anotadas. Abaixo estão exemplos de imagens do conjunto de dados, cada uma acompanhada das suas anotações correspondentes.

Imagem de amostra do conjunto de dados de deteção de assinaturas

  • Imagem em mosaico: Aqui, apresentamos um lote de formação constituído por imagens de conjuntos de dados em mosaico. O mosaico, uma técnica de formação, combina várias imagens numa só, enriquecendo a diversidade do lote. Este método ajuda a melhorar a capacidade do modelo para generalizar através de diferentes tamanhos de assinatura, rácios de aspeto e contextos.

Este exemplo ilustra a variedade e complexidade das imagens no conjunto de dados de deteção de assinaturas, realçando os benefícios da inclusão de mosaicos durante o processo de formação.

Citações e agradecimentos

O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .

FAQ

O que é o conjunto de dados de deteção de assinaturas e como pode ser utilizado?

O conjunto de dados de deteção de assinaturas é uma coleção de imagens anotadas destinadas a detetar assinaturas humanas em vários tipos de documentos. Pode ser aplicado em tarefas de visão computacional, como a deteção e o seguimento de objectos, principalmente para verificação de documentos, deteção de fraudes e investigação de arquivos. Este conjunto de dados ajuda a treinar modelos para reconhecer assinaturas em diferentes contextos, tornando-o valioso tanto para a investigação como para aplicações práticas na análise inteligente de documentos.

Como posso treinar um modelo YOLO11n no conjunto de dados de deteção de assinaturas?

Para treinar um modelo YOLO11n no conjunto de dados de deteção de assinatura, siga estas etapas:

  1. Descarregar o signature.yaml ficheiro de configuração do conjunto de dados de assinatura.yaml.
  2. Utilize o seguinte script Python ou o comando CLI para iniciar a formação:

Exemplo de comboio

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Para mais informações, consulte a página Formação.

Quais são as principais aplicações do conjunto de dados de deteção de assinaturas?

O conjunto de dados de deteção de assinaturas pode ser utilizado para:

  1. Verificação de documentos: Verificação automática da presença e autenticidade de assinaturas humanas em documentos.
  2. Deteção de fraudes: Identificação de assinaturas forjadas ou fraudulentas em documentos legais e financeiros.
  3. Investigação arquivística: Assistência a historiadores e arquivistas na análise e catalogação digital de documentos históricos.
  4. Educação: Apoio à investigação académica e ao ensino nos domínios da visão computacional e da aprendizagem automática.
  5. Serviços financeiros: Reforço da segurança nas transacções bancárias e no processamento de empréstimos através da verificação da autenticidade da assinatura.

Como posso efetuar a inferência utilizando um modelo treinado no conjunto de dados de deteção de assinaturas?

Para efetuar a inferência utilizando um modelo treinado no conjunto de dados de deteção de assinaturas, siga estes passos:

  1. Carregue o seu modelo afinado.
  2. Utilize o seguinte script Python ou o comando CLI para efetuar a inferência:

Exemplo de inferência

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Qual é a estrutura do conjunto de dados de deteção de assinaturas e onde posso obter mais informações?

O conjunto de dados de deteção de assinaturas está dividido em dois subconjuntos:

  • Conjunto de treino: Contém 143 imagens com anotações.
  • Conjunto de validação: Inclui 35 imagens com anotações.

Para obter informações pormenorizadas, pode consultar o Estrutura do conjunto de dados secção. Além disso, veja a configuração completa do conjunto de dados na secção signature.yaml ficheiro localizado em assinatura.yaml.

📅C riado há 10 meses ✏️ Atualizado há 11 dias

Comentários