署名検出データセット

このデータセットは、文書内の手書き署名を検出することに重点を置いています。署名がアノテーションされた多様な文書タイプを含んでおり、文書検証や不正検出のアプリケーションにおいて価値ある洞察を提供します。コンピュータビジョンアルゴリズムの学習に不可欠なこのデータセットは、さまざまな文書形式の署名を特定するのに役立ち、文書分析の研究や実践的なアプリケーションをサポートします。

データセットの構造

署名検出データセットは、以下の2つのサブセットに分割されています。

  • トレーニングセット: 143枚の画像とそれぞれに対応するアノテーションを含みます。
  • バリデーションセット: 35枚の画像とそれぞれに対応するアノテーションを含みます。

アプリケーション

このデータセットは、物体検出物体追跡、文書分析といったさまざまなコンピュータビジョンのタスクに適用可能です。具体的には、文書内の署名を特定するためのモデルを学習および評価するために使用でき、以下のような分野で重要な応用が可能です。

  • 文書検証: 法的文書や財務文書の検証プロセスの自動化
  • 不正検出: 偽造または不正な署名の可能性の特定
  • デジタル文書処理: 管理部門や法務部門におけるワークフローの効率化
  • 銀行・金融: 小切手処理やローン文書の検証におけるセキュリティの向上
  • アーカイブ研究: 歴史的文書の分析とカタログ作成のサポート

さらに、教育目的の貴重なリソースとしても機能し、学生や研究者がさまざまな文書タイプにわたる署名の特徴を研究することを可能にします。

データセットYAML

YAML(Yet Another Markup Language)ファイルが、パスやクラス情報を含むデータセットの設定を定義します。署名検出データセットの場合、signature.yamlファイルはhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yamlにあります。

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

使用方法

署名検出データセットでYOLO26nモデルを100エポック分、画像サイズ640で学習するには、提供されているコードサンプルを使用してください。利用可能なパラメータの完全なリストについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
推論の例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

サンプル画像とアノテーション

署名検出データセットは、さまざまな文書タイプやアノテーションされた署名を示す多種多様な画像で構成されています。以下はデータセット内の画像の例で、それぞれに対応するアノテーションが付いています。

Signature detection dataset sample image

  • モザイク画像: ここでは、モザイク処理されたデータセット画像で構成される学習バッチを表示しています。学習テクニックであるモザイク処理は、複数の画像を1つに結合し、バッチの多様性を高めます。この手法は、さまざまな署名サイズ、アスペクト比、コンテキストにわたってモデルの汎化能力を向上させるのに役立ちます。

この例は、署名検出データセット内の画像の多様性と複雑さを示しており、学習プロセスにモザイク処理を含めることの利点を強調しています。

引用と謝辞

このデータセットはAGPL-3.0 Licenseの下で公開されています。

FAQ

署名検出データセットとは何か、またどのように使用できますか?

署名検出データセットは、さまざまな文書タイプ内の人間による署名を検出することを目的としたアノテーション済み画像のコレクションです。これは、文書検証、不正検出、アーカイブ研究などを主目的として、物体検出や追跡といったコンピュータビジョンのタスクに適用できます。このデータセットは、異なるコンテキストで署名を認識するモデルを学習するのに役立ち、スマート文書分析における研究と実践的なアプリケーションの両方にとって価値があります。

署名検出データセットでYOLO26nモデルを学習するにはどうすればよいですか?

署名検出データセットでYOLO26nモデルを学習するには、以下の手順に従ってください。

  1. Download the signature.yaml dataset configuration file from signature.yaml.
  2. 以下のPythonスクリプトまたはCLIコマンドを使用して学習を開始します。
トレーニングの例
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

詳細については、トレーニングページを参照してください。

署名検出データセットの主な応用は何ですか?

署名検出データセットは以下に使用できます。

  1. 文書検証: 文書内の人間による署名の存在と真正性を自動的に検証します。
  2. 不正検出: 法的文書や財務文書内の偽造または不正な署名を特定します。
  3. アーカイブ研究: 歴史的文書のデジタル分析とカタログ作成において、歴史家やアーカイブ専門家を支援します。
  4. 教育: コンピュータビジョンや機械学習分野での学術研究や教育をサポートします。
  5. 金融サービス: 署名の真正性を検証することで、銀行取引やローン処理のセキュリティを向上させます。

署名検出データセットで学習したモデルを使用して推論を行うにはどうすればよいですか?

署名検出データセットで学習したモデルを使用して推論を行うには、以下の手順に従ってください。

  1. ファインチューニングされたモデルをロードします。
  2. 以下のPythonスクリプトまたはCLIコマンドを使用して推論を実行します。
推論の例
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

署名検出データセットの構造はどうなっており、どこで詳細情報を見つけることができますか?

署名検出データセットは2つのサブセットに分割されています。

  • トレーニングセット: アノテーション付きの143枚の画像を含みます。
  • バリデーションセット: アノテーション付きの35枚の画像を含みます。

For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.

コメント