Jeu de données de détection de signatures
Ce jeu de données se concentre sur la détection des signatures humaines manuscrites dans des documents. Il inclut une variété de types de documents avec des signatures annotées, fournissant des informations précieuses pour des applications de vérification de documents et de détection de fraudes. Essentiel pour entraîner des algorithmes de computer vision, ce jeu de données aide à identifier les signatures dans divers formats de documents, soutenant la recherche et les applications pratiques dans l'analyse de documents.
Structure du jeu de données
Le jeu de données de détection de signatures est divisé en deux sous-ensembles :
- Ensemble d'entraînement : contient 143 images, chacune avec les annotations correspondantes.
- Ensemble de validation : inclut 35 images, chacune avec des annotations appariées.
Applications
Ce jeu de données peut être appliqué dans diverses tâches de computer vision telles que object detection, object tracking et l'analyse de documents. Plus précisément, il peut être utilisé pour entraîner et évaluer des modèles afin d'identifier des signatures dans des documents, ce qui a des applications significatives dans :
- Vérification de documents : automatisation du processus de vérification pour les documents juridiques et financiers
- Détection de fraudes : identification de signatures potentiellement falsifiées ou non autorisées
- Traitement de documents numériques : rationalisation des flux de travail dans les secteurs administratif et juridique
- Banque et Finance : renforcement de la sécurité lors du traitement des chèques et de la vérification des documents de prêt
- Recherche archivistique : soutien à l'analyse et au catalogage de documents historiques
De plus, il sert de ressource précieuse à des fins éducatives, permettant aux étudiants et aux chercheurs d'étudier les caractéristiques des signatures à travers différents types de documents.
YAML du jeu de données
Un fichier YAML définit la configuration du jeu de données, y compris les chemins et les informations sur les classes. Pour le jeu de données de détection de signatures, le fichier signature.yaml est situé à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipUtilisation
Pour entraîner un modèle YOLO26n sur le jeu de données de détection de signatures pendant 100 epochs avec une taille d'image de 640, utilise les exemples de code fournis. Pour une liste complète des paramètres disponibles, consulte la page Training du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Exemples d'images et d'annotations
Le jeu de données de détection de signatures comprend une grande variété d'images présentant différents types de documents et des signatures annotées. Tu trouveras ci-dessous des exemples d'images issues du jeu de données, accompagnées de leurs annotations correspondantes.

- Image en mosaïque : nous présentons ici un lot d'entraînement composé d'images du jeu de données en mosaïque. La mosaïque, une technique d'entraînement, combine plusieurs images en une seule, enrichissant ainsi la diversité des lots. Cette méthode aide à améliorer la capacité du modèle à généraliser à travers différentes tailles, rapports d'aspect et contextes de signatures.
Cet exemple illustre la variété et la complexité des images dans le jeu de données de détection de signatures, soulignant les avantages de l'inclusion de la mosaïque pendant le processus d'entraînement.
Citations et remerciements
Le jeu de données a été publié sous la licence AGPL-3.0 License.
FAQ
Qu'est-ce que le jeu de données de détection de signatures et comment peut-il être utilisé ?
Le jeu de données de détection de signatures est une collection d'images annotées visant à détecter les signatures humaines dans divers types de documents. Il peut être appliqué dans des tâches de computer vision telles que object detection et le suivi, principalement pour la vérification de documents, la détection de fraudes et la recherche archivistique. Ce jeu de données aide à entraîner des modèles à reconnaître des signatures dans différents contextes, ce qui le rend précieux à la fois pour la recherche et pour les applications pratiques dans l'smart document analysis.
Comment entraîner un modèle YOLO26n sur le jeu de données de détection de signatures ?
Pour entraîner un modèle YOLO26n sur le jeu de données de détection de signatures, suis ces étapes :
- Télécharge le fichier de configuration du jeu de données
signature.yamldepuis signature.yaml. - Utilise le script Python ou la commande CLI suivants pour démarrer l'entraînement :
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)Pour plus de détails, consulte la page Training.
Quelles sont les principales applications du jeu de données de détection de signatures ?
Le jeu de données de détection de signatures peut être utilisé pour :
- Vérification de documents : vérifier automatiquement la présence et l'authenticité des signatures humaines dans les documents.
- Détection de fraudes : identifier les signatures falsifiées ou frauduleuses dans les documents juridiques et financiers.
- Recherche archivistique : assister les historiens et les archivistes dans l'analyse numérique et le catalogage des documents historiques.
- Éducation : soutenir la recherche universitaire et l'enseignement dans les domaines de la computer vision et du machine learning.
- Services financiers : renforcer la sécurité dans les transactions bancaires et le traitement des prêts en vérifiant l'authenticité des signatures.
Comment puis-je effectuer une inférence en utilisant un modèle entraîné sur le jeu de données de détection de signatures ?
Pour effectuer une inférence à l'aide d'un modèle entraîné sur le jeu de données de détection de signatures, suis ces étapes :
- Charge ton modèle ajusté.
- Utilise le script Python ou la commande CLI ci-dessous pour effectuer l'inférence :
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Quelle est la structure du jeu de données de détection de signatures, et où puis-je trouver plus d'informations ?
Le jeu de données de détection de signatures est divisé en deux sous-ensembles :
- Ensemble d'entraînement : contient 143 images avec des annotations.
- Ensemble de validation : inclut 35 images avec des annotations.
Pour des informations détaillées, tu peux te référer à la section Dataset Structure. De plus, consulte la configuration complète du jeu de données dans le fichier signature.yaml situé à signature.yaml.