Link to this section签名检测数据集#
此数据集专注于检测文档中的手写签名。它包含多种带有签名标注的文档类型,为文档验证和欺诈检测的应用提供了宝贵的见解。作为训练 computer vision 算法的核心资源,该数据集有助于识别各种文档格式中的签名,并支持文档分析领域的研究与实际应用。
Link to this section数据集结构#
签名检测数据集分为两个子集:
- 训练集:包含 143 张图像,每张图像均配有相应的标注。
- 验证集:包含 35 张图像,每张图像均配有成对的标注。
Link to this section应用#
该数据集可应用于多种计算机视觉任务,例如 object detection、object tracking 以及文档分析。具体而言,它可以用于训练和评估识别文档中签名的模型,这在以下领域具有重要应用:
- 文档验证:实现法律和财务文档验证过程的自动化
- 欺诈检测:识别潜在的伪造或未经授权的签名
- 数字文档处理:简化行政和法律部门的工作流程
- 银行与金融:增强支票处理和贷款文档验证过程的安全性
- 档案研究:支持历史文档的分析与编目
此外,它还是一个宝贵的教育资源,使学生和研究人员能够研究不同文档类型中的签名特征。
Link to this section数据集 YAML#
YAML (Yet Another Markup Language) 文件定义了数据集配置,包括路径和类信息。对于签名检测数据集,signature.yaml 文件位于 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipLink to this section用法#
若要在签名检测数据集上使用 640 的图像尺寸训练 YOLO26n 模型 100 个 epochs,请使用提供的代码示例。有关可用参数的完整列表,请参阅该模型的 Training 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this section样本图像和标注#
签名检测数据集包含多种展示不同文档类型和标注签名的图像。以下是来自该数据集的图像示例,每张图像均附有相应的标注。

- 马赛克图像:在此,我们展示了一批由马赛克处理后的数据集图像组成的训练批次。马赛克(Mosaicing)是一种训练技术,它将多张图像合并为一张,从而丰富了批次的多样性。该方法有助于增强模型在处理不同签名尺寸、纵横比和上下文时的泛化能力。
此示例说明了签名检测数据集中图像的多样性和复杂性,并强调了在训练过程中使用马赛克技术的优势。
Link to this section引用与致谢#
该数据集根据 AGPL-3.0 许可证 发布。
Link to this section常见问题解答#
Link to this section什么是签名检测数据集,它有什么用途?#
签名检测数据集是一组标注图像的集合,旨在检测各种文档类型中的手写签名。它可应用于计算机视觉任务,如 object detection 和跟踪,主要用于文档验证、欺诈检测和档案研究。该数据集有助于训练模型以识别不同上下文中的签名,使其对于 smart document analysis 领域的研究和实际应用都具有重要价值。
Link to this section如何使用签名检测数据集训练 YOLO26n 模型?#
若要使用签名检测数据集训练 YOLO26n 模型,请遵循以下步骤:
- Download the
signature.yamldataset configuration file from signature.yaml. - 使用以下 Python 脚本或 CLI 命令开始训练:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)更多详细信息,请参阅 Training 页面。
Link to this section签名检测数据集的主要应用有哪些?#
签名检测数据集可用于:
- 文档验证:自动验证文档中手写签名的存在性和真实性。
- 欺诈检测:识别法律和财务文档中伪造或欺诈性的签名。
- 档案研究:协助历史学家和档案保管员对历史文档进行数字分析和编目。
- 教育:支持计算机视觉和 machine learning 领域的学术研究与教学。
- 金融服务:通过验证签名的真实性,增强银行交易和贷款处理的安全性。
Link to this section如何使用在签名检测数据集上训练的模型进行推理?#
若要使用在签名检测数据集上训练的模型进行推理,请遵循以下步骤:
- 加载你微调后的模型。
- 使用以下 Python 脚本或 CLI 命令执行推理:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this section签名检测数据集的结构是怎样的?我在哪里可以找到更多信息?#
签名检测数据集分为两个子集:
- 训练集:包含 143 张带有标注的图像。
- 验证集:包含 35 张带有标注的图像。
For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.