Ensemble de données pour la détection de signatures
This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.
Structure de l'ensemble de données
L'ensemble de données de détection de signatures est divisé en trois sous-ensembles :
- Ensemble d'entraînement: Contient 143 images, chacune avec les annotations correspondantes.
- Ensemble de validation: Comprend 35 images, chacune avec des annotations appariées.
Applications
Cet ensemble de données peut être appliqué à diverses tâches de vision par ordinateur, telles que la détection et le suivi d'objets et l'analyse de documents. Plus précisément, il peut être utilisé pour former et évaluer des modèles permettant d'identifier des signatures dans des documents, ce qui peut avoir des applications dans la vérification de documents, la détection de fraudes et la recherche d'archives. En outre, il peut constituer une ressource précieuse à des fins éducatives, permettant aux étudiants et aux chercheurs d'étudier et de comprendre les caractéristiques et les comportements des signatures dans différents types de documents.
Jeu de données YAML
Un fichier YAML (Yet Another Markup Language) définit la configuration du dataset, y compris les chemins et les informations sur les classes. Pour le jeu de données de détection de signatures, le fichier signature.yaml
Le fichier se trouve à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
Utilisation
To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.
Exemple de train
Exemple de déduction
Exemples d'images et d'annotations
L'ensemble de données de détection de signatures comprend une grande variété d'images présentant différents types de documents et de signatures annotées. Tu trouveras ci-dessous des exemples d'images tirées de l'ensemble de données, chacune accompagnée de ses annotations correspondantes.
- Image mosaïque: Nous présentons ici un lot d'entraînement composé d'images de données mosaïquées. La mosaïque, une technique de formation, combine plusieurs images en une seule, enrichissant ainsi la diversité du lot. Cette méthode permet d'améliorer la capacité du modèle à se généraliser à travers différentes tailles de signature, différents rapports d'aspect et différents contextes.
Cet exemple illustre la variété et la complexité des images de l'ensemble de données de détection des signatures, soulignant les avantages de l'inclusion du mosaïquage au cours du processus de formation.
Citations et remerciements
Le jeu de données a été publié sous la licenceAGPL-3.0 .
FAQ
Qu'est-ce que le jeu de données sur la détection des signatures et comment l'utiliser ?
The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.
How do I train a YOLO11n model on the Signature Detection Dataset?
To train a YOLO11n model on the Signature Detection Dataset, follow these steps:
- Télécharger le
signature.yaml
fichier de configuration du jeu de données à partir de signature.yaml. - Utilise le script Python ou la commande CLI suivants pour démarrer la formation :
Exemple de train
Pour plus de détails, reporte-toi à la page sur la formation.
Quelles sont les principales applications de l'ensemble de données sur la détection des signatures ?
L'ensemble de données de détection des signatures peut être utilisé pour :
- Vérification de documents: Vérifier automatiquement la présence et l'authenticité des signatures humaines dans les documents.
- Détection de la fraude: Identifier les signatures falsifiées ou frauduleuses dans les documents juridiques et financiers.
- Recherche archivistique: Aider les historiens et les archivistes dans l'analyse numérique et le catalogage des documents historiques.
- Education: Supporting academic research and teaching in the fields of computer vision and machine learning.
Comment puis-je effectuer une inférence à l'aide d'un modèle formé sur l'ensemble de données de détection de signatures ?
Pour effectuer une inférence à l'aide d'un modèle entraîné sur l'ensemble de données de détection de signatures, suis les étapes suivantes :
- Charge ton modèle peaufiné.
- Utilise le script Python ou la commande CLI ci-dessous pour effectuer l'inférence :
Exemple de déduction
Quelle est la structure de l'ensemble de données sur la détection des signatures et où puis-je trouver plus d'informations ?
L'ensemble de données sur la détection des signatures est divisé en deux sous-ensembles :
- Ensemble d'entraînement: Contient 143 images avec des annotations.
- Ensemble de validation: Comprend 35 images avec des annotations.
Pour des informations plus détaillées, tu peux te référer au Structure de l'ensemble de données section. En outre, tu peux voir la configuration complète de l'ensemble de données dans la section signature.yaml
situé à l'adresse signature.yaml.