Link to this section署名検出データセット#
このデータセットは、文書内の手書き署名を検出することに焦点を当てています。署名がアノテーションされた多様な種類の文書が含まれており、文書検証や不正検出のアプリケーションにおいて有益な知見を提供します。コンピュータビジョンアルゴリズムのトレーニングに不可欠なこのデータセットは、さまざまな文書フォーマットにおける署名の特定を支援し、文書分析における研究や実用的なアプリケーションをサポートします。
Link to this sectionデータセットの構造#
署名検出データセットは、次の2つのサブセットに分割されています。
- トレーニングセット: 143枚の画像を含み、それぞれに対応するアノテーションが付属しています。
- バリデーションセット: 35枚の画像を含み、それぞれに対応するアノテーションがペアになっています。
Link to this sectionアプリケーション#
このデータセットは、object detection、object tracking、文書解析など、さまざまなコンピュータビジョンのタスクに適用できます。具体的には、文書内の署名を識別するためのモデルのトレーニングや評価に使用でき、以下のような分野で重要な応用が可能です。
- 文書検証: 法的文書や金融文書の検証プロセスの自動化
- 不正検出: 偽造または不正な署名の特定
- デジタル文書処理: 管理および法務部門におけるワークフローの効率化
- 銀行および金融: 小切手処理や融資書類の検証におけるセキュリティの強化
- アーカイブ研究: 歴史的文書の分析とカタログ作成の支援
さらに、教育目的のリソースとしても非常に価値があり、学生や研究者がさまざまな文書タイプにわたる署名の特徴を研究することを可能にします。
Link to this sectionデータセット YAML#
YAML(Yet Another Markup Language)ファイルが、パスやクラス情報を含むデータセットの構成を定義しています。署名検出データセットの場合、signature.yamlファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml にあります。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipLink to this section使用方法#
署名検出データセットでYOLO26nモデルを100 エポック分トレーニングし、画像サイズを640にするには、提供されているコードサンプルを使用してください。利用可能なパラメータの完全なリストについては、モデルのトレーニングページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this sectionサンプル画像とアノテーション#
署名検出データセットは、さまざまな文書タイプやアノテーション済みの署名を含む多種多様な画像で構成されています。以下はデータセットの画像の例であり、それぞれに対応するアノテーションが付属しています。

- モザイク画像: ここでは、モザイク処理されたデータセット画像で構成されるトレーニングバッチを表示しています。トレーニングテクニックの一つであるモザイク処理は、複数の画像を1つに結合してバッチの多様性を高めます。この手法は、さまざまな署名サイズ、アスペクト比、コンテキストにわたってモデルの汎化能力を向上させるのに役立ちます。
この例は、署名検出データセットに含まれる画像の多様性と複雑さを示しており、トレーニングプロセス中にモザイク処理を取り入れることの利点を強調しています。
Link to this section引用と謝辞#
このデータセットはAGPL-3.0ライセンスの下で公開されています。
Link to this sectionよくある質問 (FAQ)#
Link to this section署名検出データセットとは何ですか、またどのように使用できますか?#
署名検出データセットは、さまざまな文書タイプ内の手書き署名を検出することを目的としたアノテーション済み画像のコレクションです。主に文書検証、不正検出、アーカイブ研究のための物体検出や追跡といったコンピュータビジョンのタスクに適用できます。このデータセットは、モデルがさまざまな状況で署名を認識するようにトレーニングするのに役立ち、スマート文書分析における研究と実用的なアプリケーションの両方に価値があります。
Link to this section署名検出データセットでYOLO26nモデルをトレーニングするにはどうすればよいですか?#
署名検出データセットでYOLO26nモデルをトレーニングするには、以下の手順に従ってください。
signature.yamlデータセット設定ファイルを signature.yaml からダウンロードしてください。- 以下のPythonスクリプトまたはCLIコマンドを使用してトレーニングを開始します。
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)詳細については、トレーニングページを参照してください。
Link to this section署名検出データセットの主なアプリケーションは何ですか?#
署名検出データセットは、以下の用途に使用できます。
- 文書検証: 文書内の手書き署名の有無と真正性を自動的に検証します。
- 不正検出: 法的文書や金融文書内の偽造または不正な署名を特定します。
- アーカイブ研究: 歴史的文書のデジタル分析やカタログ作成において、歴史学者やアーカイブ担当者を支援します。
- 教育: コンピュータビジョンや機械学習の分野における学術研究や教育をサポートします。
- 金融サービス: 署名の真正性を検証することで、銀行取引や融資処理のセキュリティを強化します。
Link to this section署名検出データセットでトレーニングされたモデルを使用して推論を行うにはどうすればよいですか?#
署名検出データセットでトレーニングされたモデルを使用して推論を行うには、以下の手順に従ってください。
- 微調整したモデルを読み込みます。
- 以下のPythonスクリプトまたはCLIコマンドを使用して推論を実行します。
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this section署名検出データセットの構成はどうなっていますか、また詳細情報はどこで確認できますか?#
署名検出データセットは、次の2つのサブセットに分けられています。
- トレーニングセット: アノテーション付きの143枚の画像を含みます。
- バリデーションセット: アノテーション付きの35枚の画像を含みます。
For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.