シグネチャー検出データセット
This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.
データセット構造
シグネチャ検出データセットは3つのサブセットに分割される:
- トレーニングセット:143枚の画像が含まれ、それぞれに対応する注釈が付けられている。
- 検証セット:35枚の画像を含み、それぞれに対になった注釈がある。
アプリケーション
このデータセットは、物体検出、物体追跡、文書解析など、様々なコンピュータビジョンタスクに応用できる。具体的には、文書中の署名を識別するモデルの訓練と評価に使用でき、文書検証、不正検出、アーカイブ研究に応用できる。さらに、学生や研究者が様々な種類の文書における署名の特徴や振る舞いを研究し理解することを可能にする、教育目的のための貴重なリソースとしても機能します。
データセット YAML
YAML(Yet Another Markup Language)ファイルは、パスやクラス情報を含むデータセットの設定を定義する。シグネチャ検出データセットでは signature.yaml
ファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
使用方法
To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.
列車の例
推論例
サンプル画像と注釈
署名検出データセットは、様々な種類の文書と注釈付き署名を紹介する多種多様な画像から構成される。以下はデータセットの画像の例で、それぞれに対応する注釈が添えられています。
- モザイク画像:ここでは、モザイク処理されたデータセット画像からなるトレーニングバッチを紹介する。モザイキングは、複数の画像を1つに統合し、バッチの多様性を豊かにする学習手法である。この方法は、異なるシグネチャサイズ、アスペクト比、コンテクストにわたってモデルの一般化能力を高めるのに役立つ。
この例は、署名検出データセットに含まれる画像の多様性と複雑性を示しており、学習プロセス中にモザイク処理を含めることの利点を強調している。
引用と謝辞
このデータセットは、AGPL-3.0 ライセンスの下で公開されている。
よくあるご質問
シグネチャー検出データセットとは?
The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.
How do I train a YOLO11n model on the Signature Detection Dataset?
To train a YOLO11n model on the Signature Detection Dataset, follow these steps:
- ダウンロード
signature.yaml
データセット設定ファイル signature.yaml. - 以下のPython スクリプトまたはCLI コマンドを使用してトレーニングを開始する:
列車の例
詳細はトレーニングのページを参照。
シグネチャー検出データセットの主な用途は?
Signature Detection Datasetは以下の用途に使用できる:
- 文書の検証:文書内の人間の署名の存在と真正性を自動的に検証する。
- 不正の検出:法的文書や財務文書における偽造または不正な署名を特定する。
- アーカイブ研究:歴史家やアーキビストの歴史文書のデジタル分析および目録作成を支援する。
- Education: Supporting academic research and teaching in the fields of computer vision and machine learning.
Signature Detection Datasetで学習したモデルを用いて推論を行うには?
Signature Detection Datasetで学習したモデルを用いて推論を行うには、以下の手順に従う:
- 微調整したモデルをロードする。
- 推論を行うには、以下のPython スクリプトまたはCLI コマンドを使用する:
推論例
シグネチャー検出データセットの構成と、詳しい情報はどこにありますか?
署名検出データセットは2つのサブセットに分けられる:
- トレーニングセット:注釈付き画像143枚を含む。
- 検証セット:注釈付き画像35枚を含む。
詳しい情報は データセット構造 セクションを参照してください。さらに、データセットのコンフィギュレーション全体を signature.yaml
ファイルは signature.yaml.