Conjunto de dados de deteção de assinaturas
Este conjunto de dados centra-se na deteção de assinaturas humanas escritas em documentos. Inclui uma variedade de tipos de documentos com assinaturas anotadas, fornecendo informações valiosas para aplicações na verificação de documentos e deteção de fraudes. Essencial para o treino de algoritmos de visão por computador, este conjunto de dados ajuda a identificar assinaturas em vários formatos de documentos, apoiando a investigação e aplicações práticas na análise de documentos.
Estrutura do conjunto de dados
O conjunto de dados de deteção de assinaturas está dividido em dois subconjuntos:
- Conjunto de treino: Contém 143 imagens, cada uma com anotações correspondentes.
- Conjunto de validação: Inclui 35 imagens, cada uma com anotações emparelhadas.
Aplicações
Este conjunto de dados pode ser aplicado em várias tarefas de visão computacional, como a deteção de objectos, o seguimento de objectos e a análise de documentos. Especificamente, pode ser utilizado para treinar e avaliar modelos para identificar assinaturas em documentos, o que tem aplicações significativas em:
- Verificação de documentos: Automatização do processo de verificação de documentos legais e financeiros
- Deteção de fraudes: Identificação de assinaturas potencialmente falsificadas ou não autorizadas
- Processamento digital de documentos: Simplificação dos fluxos de trabalho nos sectores administrativo e jurídico
- Banca e finanças: Reforço da segurança no processamento de cheques e na verificação de documentos de empréstimos
- Investigação arquivística: Apoio à análise e catalogação de documentos históricos
Além disso, serve como um recurso valioso para fins educativos, permitindo aos estudantes e investigadores estudar as caraterísticas das assinaturas em diferentes tipos de documentos.
Conjunto de dados YAML
Um ficheiro YAML (Yet Another Markup Language) define a configuração do conjunto de dados, incluindo caminhos e informações sobre classes. Para o conjunto de dados de deteção de assinatura, o arquivo signature.yaml
O ficheiro está localizado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
Utilização
Para treinar um modelo YOLO11n no conjunto de dados de deteção de assinaturas para 100 épocas com um tamanho de imagem de 640, utilize os exemplos de código fornecidos. Para obter uma lista completa dos parâmetros disponíveis, consulte a página de treinamento do modelo.
Exemplo de comboio
Exemplo de inferência
Exemplos de imagens e anotações
O conjunto de dados de deteção de assinaturas inclui uma grande variedade de imagens que mostram diferentes tipos de documentos e assinaturas anotadas. Abaixo estão exemplos de imagens do conjunto de dados, cada uma acompanhada das suas anotações correspondentes.
- Imagem em mosaico: Aqui, apresentamos um lote de formação constituído por imagens de conjuntos de dados em mosaico. O mosaico, uma técnica de formação, combina várias imagens numa só, enriquecendo a diversidade do lote. Este método ajuda a melhorar a capacidade do modelo para generalizar através de diferentes tamanhos de assinatura, rácios de aspeto e contextos.
Este exemplo ilustra a variedade e complexidade das imagens no conjunto de dados de deteção de assinaturas, realçando os benefícios da inclusão de mosaicos durante o processo de formação.
Citações e agradecimentos
O conjunto de dados foi disponibilizado ao abrigo da licençaAGPL-3.0 .
FAQ
O que é o conjunto de dados de deteção de assinaturas e como pode ser utilizado?
O conjunto de dados de deteção de assinaturas é uma coleção de imagens anotadas destinadas a detetar assinaturas humanas em vários tipos de documentos. Pode ser aplicado em tarefas de visão computacional, como a deteção e o seguimento de objectos, principalmente para verificação de documentos, deteção de fraudes e investigação de arquivos. Este conjunto de dados ajuda a treinar modelos para reconhecer assinaturas em diferentes contextos, tornando-o valioso tanto para a investigação como para aplicações práticas na análise inteligente de documentos.
Como posso treinar um modelo YOLO11n no conjunto de dados de deteção de assinaturas?
Para treinar um modelo YOLO11n no conjunto de dados de deteção de assinatura, siga estas etapas:
- Descarregar o
signature.yaml
ficheiro de configuração do conjunto de dados de assinatura.yaml. - Utilize o seguinte script Python ou o comando CLI para iniciar a formação:
Exemplo de comboio
Para mais informações, consulte a página Formação.
Quais são as principais aplicações do conjunto de dados de deteção de assinaturas?
O conjunto de dados de deteção de assinaturas pode ser utilizado para:
- Verificação de documentos: Verificação automática da presença e autenticidade de assinaturas humanas em documentos.
- Deteção de fraudes: Identificação de assinaturas forjadas ou fraudulentas em documentos legais e financeiros.
- Investigação arquivística: Assistência a historiadores e arquivistas na análise e catalogação digital de documentos históricos.
- Educação: Apoio à investigação académica e ao ensino nos domínios da visão computacional e da aprendizagem automática.
- Serviços financeiros: Reforço da segurança nas transacções bancárias e no processamento de empréstimos através da verificação da autenticidade da assinatura.
Como posso efetuar a inferência utilizando um modelo treinado no conjunto de dados de deteção de assinaturas?
Para efetuar a inferência utilizando um modelo treinado no conjunto de dados de deteção de assinaturas, siga estes passos:
- Carregue o seu modelo afinado.
- Utilize o seguinte script Python ou o comando CLI para efetuar a inferência:
Exemplo de inferência
Qual é a estrutura do conjunto de dados de deteção de assinaturas e onde posso obter mais informações?
O conjunto de dados de deteção de assinaturas está dividido em dois subconjuntos:
- Conjunto de treino: Contém 143 imagens com anotações.
- Conjunto de validação: Inclui 35 imagens com anotações.
Para obter informações pormenorizadas, pode consultar o Estrutura do conjunto de dados secção. Além disso, veja a configuração completa do conjunto de dados na secção signature.yaml
ficheiro localizado em assinatura.yaml.