Skip to content

Ensemble de données pour la détection de signatures

Cet ensemble de données se concentre sur la détection de signatures humaines écrites dans des documents. Il comprend une variété de types de documents avec des signatures annotées, fournissant des informations précieuses pour les applications de vérification de documents et de détection de la fraude. Essentiel pour l'entraînement des algorithmes de vision par ordinateur, cet ensemble de données permet d'identifier les signatures dans divers formats de documents, ce qui facilite la recherche et les applications pratiques dans le domaine de l'analyse des documents.

Structure de l'ensemble de données

L'ensemble de données de détection de signatures est divisé en trois sous-ensembles :

  • Ensemble d'entraînement: Contient 143 images, chacune avec les annotations correspondantes.
  • Ensemble de validation: Comprend 35 images, chacune avec des annotations appariées.

Applications

Cet ensemble de données peut être appliqué à diverses tâches de vision par ordinateur, telles que la détection et le suivi d'objets, ainsi que l'analyse de documents. En particulier, il peut être utilisé pour former et évaluer des modèles d'identification de signatures dans des documents, ce qui peut avoir des applications dans la vérification de documents, la détection de fraudes et la recherche d'archives. En outre, il peut constituer une ressource précieuse à des fins éducatives, permettant aux étudiants et aux chercheurs d'étudier et de comprendre les caractéristiques et les comportements des signatures dans différents types de documents.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) définit la configuration de l'ensemble de données, y compris les chemins d'accès et les informations sur les classes. Pour le jeu de données de détection de signatures, le fichier signature.yaml est situé à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilisation

Pour entraîner un modèle YOLO11n sur l'ensemble de données de détection de signatures pour 100 époques avec une taille d'image de 640, utilisez les exemples de code fournis. Pour une liste complète des paramètres disponibles, reportez-vous à la page d'entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemple d'inférence

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Exemples d'images et d'annotations

L'ensemble de données de détection de signatures comprend une grande variété d'images présentant différents types de documents et de signatures annotées. Vous trouverez ci-dessous des exemples d'images tirées de l'ensemble de données, chacune accompagnée des annotations correspondantes.

Détection de signature ensemble de données échantillon d'image

  • Image mosaïque: Nous présentons ici un lot d'entraînement composé d'images mosaïquées de l'ensemble des données. La mosaïque, une technique d'apprentissage, combine plusieurs images en une seule, enrichissant ainsi la diversité du lot. Cette méthode permet d'améliorer la capacité du modèle à se généraliser en fonction de la taille des signatures, des rapports d'aspect et des contextes.

Cet exemple illustre la variété et la complexité des images de l'ensemble de données de détection des signatures, et met en évidence les avantages de l'intégration du mosaïquage au cours du processus d'apprentissage.

Citations et remerciements

Le jeu de données a été publié sous la licenceAGPL-3.0 .

FAQ

Qu'est-ce que l'ensemble de données sur la détection des signatures et comment l'utiliser ?

Le jeu de données sur la détection des signatures est une collection d'images annotées visant à détecter les signatures humaines dans divers types de documents. Il peut être utilisé dans des tâches de vision artificielle telles que la détection et le suivi d'objets, principalement pour la vérification de documents, la détection de fraudes et la recherche d'archives. Ce jeu de données permet de former des modèles de reconnaissance de signatures dans différents contextes, ce qui le rend précieux tant pour la recherche que pour les applications pratiques.

Comment entraîner un modèle YOLO11n sur l'ensemble de données de détection de signatures ?

Pour entraîner un modèle YOLO11n sur l'ensemble de données de détection de signatures, procédez comme suit :

  1. Télécharger le signature.yaml fichier de configuration du jeu de données à partir de signature.yaml.
  2. Utilisez le script Python ou la commande CLI pour démarrer la formation :

Exemple de train

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Pour plus de détails, voir la page Formation.

Quelles sont les principales applications de l'ensemble de données sur la détection des signatures ?

L'ensemble de données de détection de signatures peut être utilisé pour :

  1. Vérification de documents: Vérification automatique de la présence et de l'authenticité des signatures humaines dans les documents.
  2. Détection de la fraude: Identification des signatures falsifiées ou frauduleuses dans les documents juridiques et financiers.
  3. Recherche archivistique: Assister les historiens et les archivistes dans l'analyse numérique et le catalogage de documents historiques.
  4. L'éducation: Soutenir la recherche universitaire et l'enseignement dans les domaines de la vision artificielle et de l'apprentissage automatique.

Comment puis-je effectuer une inférence à l'aide d'un modèle entraîné sur l'ensemble de données de détection des signatures ?

Pour effectuer une inférence à l'aide d'un modèle formé sur l'ensemble de données de détection des signatures, procédez comme suit :

  1. Chargez votre modèle affiné.
  2. Utilisez le script Python ou la commande CLI ci-dessous pour effectuer l'inférence :

Exemple d'inférence

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Quelle est la structure de l'ensemble de données sur la détection des signatures et où puis-je trouver plus d'informations ?

L'ensemble de données sur la détection des signatures est divisé en deux sous-ensembles :

  • Ensemble d'entraînement: Contient 143 images avec des annotations.
  • Ensemble de validation: Comprend 35 images avec des annotations.

Pour des informations détaillées, vous pouvez vous référer au Structure de l'ensemble de données section. En outre, vous pouvez consulter la configuration complète de l'ensemble de données dans la section signature.yaml situé à l'adresse signature.yaml.

📅 Created 7 months ago ✏️ Updated 3 months ago

Commentaires