Passer au contenu

Jeu de données de détection de signatures

Ce jeu de données se concentre sur la détection de signatures manuscrites dans des documents. Il comprend une variété de types de documents avec des signatures annotées, fournissant des informations précieuses pour les applications de vérification de documents et de détection de fraude. Essentiel pour la formation des algorithmes de vision par ordinateur, ce jeu de données aide à identifier les signatures dans divers formats de documents, soutenant la recherche et les applications pratiques dans l'analyse de documents.

Structure du jeu de données

L'ensemble de données de détection de signatures est divisé en deux sous-ensembles:

  • Ensemble d'entraînement : Contient 143 images, chacune avec ses annotations correspondantes.
  • Ensemble de validation : Comprend 35 images, chacune avec des annotations appariées.

Applications

Cet ensemble de données peut être appliqué dans diverses tâches de vision par ordinateur telles que la détection d'objets, le suivi d'objets et l'analyse de documents. Plus précisément, il peut être utilisé pour entraîner et évaluer des modèles pour identifier les signatures dans les documents, ce qui a des applications importantes dans :

  • Vérification de documents : Automatisation du processus de vérification des documents juridiques et financiers
  • Détection de fraude : Identification des signatures potentiellement falsifiées ou non autorisées
  • Traitement numérique des documents : Rationalisation des flux de travail dans les secteurs administratif et juridique
  • Banque et finance : Amélioration de la sécurité dans le traitement des chèques et la vérification des documents de prêt
  • Recherche archivistique : Soutien à l'analyse et au catalogage de documents historiques

De plus, il constitue une ressource précieuse à des fins éducatives, permettant aux étudiants et aux chercheurs d'étudier les caractéristiques distinctives des différents types de documents.

YAML du jeu de données

Un fichier YAML (Yet Another Markup Language) définit la configuration de l’ensemble de données, y compris les chemins d’accès et les informations sur les classes. Pour l’ensemble de données de détection de signature, le signature.yaml le fichier est situé à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilisation

Pour entraîner un modèle YOLO11n sur l’ensemble de données de détection de signature pour 100 époques avec une taille d’image de 640, utilisez les exemples de code fournis. Pour une liste complète des paramètres disponibles, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemple d'inférence

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Images et annotations d'exemple

L’ensemble de données de détection de signature comprend une grande variété d’images présentant différents types de documents et des signatures annotées. Vous trouverez ci-dessous des exemples d’images de l’ensemble de données, chacune accompagnée de ses annotations correspondantes.

Exemple d'image du jeu de données de détection de signature

  • Image en mosaïque : nous présentons ici un lot d’entraînement composé d’images de l’ensemble de données en mosaïque. La mosaïque, une technique d’entraînement, combine plusieurs images en une seule, ce qui enrichit la diversité des lots. Cette méthode permet d’améliorer la capacité du modèle à généraliser à différentes tailles de signature, différents rapports hauteur/largeur et différents contextes.

Cet exemple illustre la variété et la complexité des images dans l’ensemble de données de détection de signature, soulignant les avantages de l’inclusion de la mosaïque pendant le processus d’entraînement.

Citations et remerciements

L'ensemble de données a été publié sous la licence AGPL-3.0.

FAQ

Qu'est-ce que le jeu de données Signature Detection et comment peut-il être utilisé ?

L'ensemble de données de détection de signatures est une collection d'images annotées visant à détecter les signatures humaines dans différents types de documents. Il peut être appliqué dans des tâches de vision par ordinateur telles que la détection d'objets et le suivi, principalement pour la vérification de documents, la détection de fraude et la recherche archivistique. Cet ensemble de données aide à entraîner des modèles pour reconnaître les signatures dans différents contextes, ce qui le rend précieux pour la recherche et les applications pratiques dans l'analyse intelligente de documents.

Comment entraîner un modèle YOLO11n sur le jeu de données Signature Detection ?

Pour entraîner un modèle YOLO11n sur l’ensemble de données de détection de signature, suivez ces étapes :

  1. Télécharger le signature.yaml fichier de configuration de l’ensemble de données à partir de signature.yaml.
  2. Utilisez le script python ou la commande CLI suivante pour démarrer l'entraînement :

Exemple d'entraînement

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Pour plus de détails, consultez la page Formation.

Quelles sont les principales applications du jeu de données Signature Detection ?

L'ensemble de données de détection de signatures peut être utilisé pour :

  1. Vérification de documents : Vérification automatique de la présence et de l'authenticité des signatures humaines dans les documents.
  2. Détection de fraude : Identification des signatures contrefaites ou frauduleuses dans les documents juridiques et financiers.
  3. Recherche archivistique : Aider les historiens et les archivistes dans l'analyse numérique et le catalogage des documents historiques.
  4. Éducation : Soutien à la recherche académique et à l’enseignement dans les domaines de la vision par ordinateur et de l’apprentissage automatique.
  5. Services financiers : Améliorer la sécurité des transactions bancaires et du traitement des prêts en vérifiant l’authenticité de la signature.

Comment puis-je effectuer une inférence à l'aide d'un modèle entraîné sur le jeu de données Signature Detection ?

Pour effectuer une inférence à l'aide d'un modèle entraîné sur l'ensemble de données de détection de signatures, suivez ces étapes :

  1. Chargez votre modèle affiné.
  2. Utilisez le script python ci-dessous ou la commande CLI pour effectuer l’inférence :

Exemple d'inférence

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Quelle est la structure du jeu de données Signature Detection et où puis-je trouver plus d'informations ?

L’ensemble de données de détection de signature est divisé en deux sous-ensembles :

  • Ensemble d’entraînement : Contient 143 images avec des annotations.
  • Ensemble de validation : Comprend 35 images avec des annotations.

Pour des informations détaillées, vous pouvez consulter la Structure du jeu de données section. De plus, consultez la configuration complète de l'ensemble de données dans le signature.yaml fichier situé dans signature.yaml.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 5 mois

Commentaires