签名检测数据集
该数据集专注于检测文档中人类手写的签名。它包含多种带有标注签名的文档类型,为文档验证和欺诈检测等应用提供了宝贵的见解。该数据集对于训练 计算机视觉 算法至关重要,有助于在各种文档格式中识别签名,并支持文档分析领域的科研与实际应用。
数据集结构
签名检测数据集分为两个子集:
- 训练集:包含 143 张图像,每张图像都有相应的标注。
- 验证集:包含 35 张图像,每张图像都有成对的标注。
应用场景
该数据集可应用于多种计算机视觉任务,例如 目标检测、目标跟踪 和文档分析。具体而言,它可用于训练和评估识别文档签名的模型,这些模型在以下领域具有重要应用:
- 文档验证:实现法律和金融文档验证流程的自动化
- 欺诈检测:识别潜在的伪造或未经授权的签名
- 数字文档处理:简化行政和法律部门的工作流程
- 银行与金融:加强支票处理和贷款文档验证的安全性
- 档案研究:支持历史文档的分析和编目
此外,它还是教育领域的宝贵资源,使学生和研究人员能够研究不同文档类型中的签名特征。
数据集 YAML
YAML(Yet Another Markup Language)文件定义了数据集配置,包括路径和类别信息。对于签名检测数据集,signature.yaml 文件位于 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip使用方法
若要使用图像尺寸 640 在签名检测数据集上训练 YOLO26n 模型 100 个 轮次,请参考提供的代码示例。有关可用参数的完整列表,请参阅该模型的 训练 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)样本图像和标注
签名检测数据集包含各种展示不同文档类型和标注签名的图像。以下是来自该数据集的图像示例,每张图像都附有相应的标注。

- 马赛克图像:此处展示了一个由马赛克数据集图像组成的训练批次。马赛克(Mosaicing)是一种训练技术,它将多张图像组合成一张,从而丰富了批次的多样性。该方法有助于提高模型在不同签名尺寸、长宽比和背景下的泛化能力。
此示例说明了签名检测数据集中图像的多样性和复杂性,并强调了在训练过程中加入马赛克技术的益处。
引文与致谢
该数据集根据 AGPL-3.0 License 发布。
常见问题 (FAQ)
什么是签名检测数据集,以及如何使用它?
签名检测数据集是一组经过标注的图像集,旨在检测各种文档类型中的人类签名。它可应用于 目标检测 和跟踪等计算机视觉任务,主要用于文档验证、欺诈检测和档案研究。该数据集有助于训练模型识别不同场景下的签名,使其在 智能文档分析 的科研和实际应用中极具价值。
如何使用签名检测数据集训练 YOLO26n 模型?
要使用签名检测数据集训练 YOLO26n 模型,请按照以下步骤操作:
- Download the
signature.yamldataset configuration file from signature.yaml. - 使用以下 Python 脚本或 CLI 命令开始训练:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)有关更多详细信息,请参阅 训练 页面。
签名检测数据集的主要应用有哪些?
签名检测数据集可用于:
- 文档验证:自动验证文档中人类签名的存在与真实性。
- 欺诈检测:识别法律和金融文档中伪造或欺诈性的签名。
- 档案研究:协助历史学家和档案管理员对历史文档进行数字化分析和编目。
- 教育:支持计算机视觉和 机器学习 领域的学术研究与教学。
- 金融服务:通过验证签名的真实性,增强银行交易和贷款处理的安全性。
如何使用在签名检测数据集上训练的模型进行推理?
要使用在签名检测数据集上训练的模型进行推理,请按照以下步骤操作:
- 加载你微调后的模型。
- 使用以下 Python 脚本或 CLI 命令进行推理:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)签名检测数据集的结构是什么,在哪里可以找到更多信息?
签名检测数据集分为两个子集:
- 训练集:包含 143 张带有标注的图像。
- 验证集:包含 35 张带有标注的图像。
For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.