签名检测数据集

该数据集专注于检测文档中人类手写的签名。它包含多种带有标注签名的文档类型,为文档验证和欺诈检测等应用提供了宝贵的见解。该数据集对于训练 计算机视觉 算法至关重要,有助于在各种文档格式中识别签名,并支持文档分析领域的科研与实际应用。

数据集结构

签名检测数据集分为两个子集:

  • 训练集:包含 143 张图像,每张图像都有相应的标注。
  • 验证集:包含 35 张图像,每张图像都有成对的标注。

应用场景

该数据集可应用于多种计算机视觉任务,例如 目标检测目标跟踪 和文档分析。具体而言,它可用于训练和评估识别文档签名的模型,这些模型在以下领域具有重要应用:

  • 文档验证:实现法律和金融文档验证流程的自动化
  • 欺诈检测:识别潜在的伪造或未经授权的签名
  • 数字文档处理:简化行政和法律部门的工作流程
  • 银行与金融:加强支票处理和贷款文档验证的安全性
  • 档案研究:支持历史文档的分析和编目

此外,它还是教育领域的宝贵资源,使学生和研究人员能够研究不同文档类型中的签名特征。

数据集 YAML

YAML(Yet Another Markup Language)文件定义了数据集配置,包括路径和类别信息。对于签名检测数据集,signature.yaml 文件位于 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

使用方法

若要使用图像尺寸 640 在签名检测数据集上训练 YOLO26n 模型 100 个 轮次,请参考提供的代码示例。有关可用参数的完整列表,请参阅该模型的 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
推理示例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

样本图像和标注

签名检测数据集包含各种展示不同文档类型和标注签名的图像。以下是来自该数据集的图像示例,每张图像都附有相应的标注。

签名检测数据集示例图像

  • 马赛克图像:此处展示了一个由马赛克数据集图像组成的训练批次。马赛克(Mosaicing)是一种训练技术,它将多张图像组合成一张,从而丰富了批次的多样性。该方法有助于提高模型在不同签名尺寸、长宽比和背景下的泛化能力。

此示例说明了签名检测数据集中图像的多样性和复杂性,并强调了在训练过程中加入马赛克技术的益处。

引文与致谢

该数据集根据 AGPL-3.0 License 发布。

常见问题 (FAQ)

什么是签名检测数据集,以及如何使用它?

签名检测数据集是一组经过标注的图像集,旨在检测各种文档类型中的人类签名。它可应用于 目标检测 和跟踪等计算机视觉任务,主要用于文档验证、欺诈检测和档案研究。该数据集有助于训练模型识别不同场景下的签名,使其在 智能文档分析 的科研和实际应用中极具价值。

如何使用签名检测数据集训练 YOLO26n 模型?

要使用签名检测数据集训练 YOLO26n 模型,请按照以下步骤操作:

  1. Download the signature.yaml dataset configuration file from signature.yaml.
  2. 使用以下 Python 脚本或 CLI 命令开始训练:
训练示例
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

有关更多详细信息,请参阅 训练 页面。

签名检测数据集的主要应用有哪些?

签名检测数据集可用于:

  1. 文档验证:自动验证文档中人类签名的存在与真实性。
  2. 欺诈检测:识别法律和金融文档中伪造或欺诈性的签名。
  3. 档案研究:协助历史学家和档案管理员对历史文档进行数字化分析和编目。
  4. 教育:支持计算机视觉和 机器学习 领域的学术研究与教学。
  5. 金融服务:通过验证签名的真实性,增强银行交易和贷款处理的安全性。

如何使用在签名检测数据集上训练的模型进行推理?

要使用在签名检测数据集上训练的模型进行推理,请按照以下步骤操作:

  1. 加载你微调后的模型。
  2. 使用以下 Python 脚本或 CLI 命令进行推理:
推理示例
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

签名检测数据集的结构是什么,在哪里可以找到更多信息?

签名检测数据集分为两个子集:

  • 训练集:包含 143 张带有标注的图像。
  • 验证集:包含 35 张带有标注的图像。

For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.

评论