Link to this sectionTập dữ liệu Phát hiện Chữ ký#

Name: Tập dữ liệu Phát hiện Chữ ký
Creator: Ultralytics
License: https://www.ultralytics.com/license
Keywords: Tập dữ liệu Phát hiện Chữ ký, phát hiện chữ ký, xác thực tài liệu, phát hiện gian lận, object detection, computer vision, YOLO26, Ultralytics, chữ ký được chú thích, phân tích tài liệu

Tập dữ liệu Signature Detection của Ultralytics là một tập dữ liệu object detection gồm 178 ảnh tài liệu được gán nhãn với một lớp duy nhất là signature, được chia sẵn thành 143 ảnh huấn luyện và 35 ảnh kiểm thử. Tập dữ liệu tự động tải xuống (11,3 MB) trong lần đầu tiên bạn huấn luyện, tạo nên một điểm khởi đầu gọn nhẹ cho các ứng dụng computer vision như xác thực tài liệu, phát hiện gian lận và xử lý tài liệu kỹ thuật số.

Link to this sectionCấu trúc tập dữ liệu#

Tập dữ liệu chứa 178 hình ảnh của nhiều loại tài liệu khác nhau có chữ ký viết tay, được chia thành hai tập con:

Split	Hình ảnh	Mô tả
Huấn luyện (Train)	143	Hình ảnh được gán nhãn cho việc huấn luyện model
Validation	35	Ảnh giữ lại để evaluation

Mỗi ảnh đều có các chú thích bounding-box cho một lớp, signature, và cấu hình không định nghĩa tệp kiểm thử riêng biệt.

Tự động tải xuống

Tập dữ liệu Signature Detection (11,3 MB) tự động tải xuống từ các tài nguyên GitHub của Ultralytics trong lần đầu bạn huấn luyện, vì vậy không cần tải xuống hoặc chuẩn bị thủ công.

Khám phá Signature on Ultralytics Platform để duyệt qua các hình ảnh cùng với các lớp phủ chú thích của chúng, xem phân bổ lớp và bản đồ nhiệt bounding-box trong tab Charts, và sao chép nó để huấn luyện model của riêng bạn trên đám mây.

Link to this sectionỨng dụng#

Một model được huấn luyện trên tập dữ liệu này có thể xác định và track chữ ký trong tài liệu đã quét và video, hỗ trợ:

Xác thực tài liệu: Tự động hóa việc kiểm tra chữ ký trong các văn bản pháp lý và tài chính
Fraud Detection: Xác định các chữ ký có khả năng bị làm giả hoặc trái phép
Digital Document Processing: Tối ưu hóa quy trình làm việc trong các lĩnh vực hành chính và pháp lý
Banking and Finance: Tăng cường bảo mật trong xử lý séc và xác thực tài liệu vay vốn
Archival Research: Hỗ trợ phân tích và lập danh mục tài liệu lịch sử
Giáo dục và Nghiên cứu: Nghiên cứu đặc điểm chữ ký qua các loại tài liệu trong các khóa học computer vision

Link to this sectionYAML tập dữ liệu#

Tệp signature.yaml định nghĩa cấu hình tập dữ liệu — bao gồm các đường dẫn tập dữ liệu, tên lớp và các metadata khác. Tệp này được duy trì trong kho lưu trữ Ultralytics tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Link to this sectionCách sử dụng#

Để huấn luyện một model YOLO26n trên tập dữ liệu Signature Detection trong 100 epochs với kích thước ảnh 640, hãy sử dụng các mẫu mã được cung cấp. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Training của model.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Sau khi huấn luyện, bạn có thể chạy inference trên tài liệu hoặc video với model đã được tinh chỉnh. Ví dụ dưới đây chạy dự đoán trên một video mẫu với ngưỡng tin cậy là 0,75:

Ví dụ về Inference

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Link to this sectionHình ảnh mẫu và chú thích#

Tập dữ liệu bao gồm nhiều định dạng tài liệu, giúp các model đã huấn luyện khái quát hóa trên các hợp đồng, biểu mẫu và thư từ. Dưới đây là một batch huấn luyện từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu phát hiện chữ ký

Mosaiced Image: Tại đây, chúng tôi trình bày một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật mosaic. Mosaic, một kỹ thuật huấn luyện, kết hợp nhiều hình ảnh thành một, giúp làm phong phú thêm sự đa dạng của batch. Phương pháp này giúp nâng cao khả năng tổng quát hóa của model trên các kích thước chữ ký, tỷ lệ khung hình và bối cảnh khác nhau.

Link to this sectionTrích dẫn và Ghi nhận#

Bộ dữ liệu đã được cung cấp theo Giấy phép AGPL-3.0.

Nếu bạn sử dụng tập dữ liệu Signature Detection trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn nó một cách phù hợp:

Trích dẫn

@dataset{Ultralytics_Signature_Detection_Dataset_2024,
    author = {Ultralytics},
    title = {Signature Detection Dataset},
    year = {2024},
    publisher = {Ultralytics},
    url = {https://docs.ultralytics.com/datasets/detect/signature/}
}

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu Signature Detection được sử dụng để làm gì?#

Tập dữ liệu Signature Detection là một bộ sưu tập gồm 178 ảnh tài liệu đã được gán nhãn để huấn luyện các model phát hiện chữ ký viết tay. Nó hỗ trợ xác thực tài liệu, phát hiện gian lận và nghiên cứu lưu trữ, đồng thời là cơ sở thực tế để xây dựng các hệ thống smart document analysis với machine learning.

Link to this sectionLàm thế nào để tôi tải xuống tập dữ liệu Signature Detection?#

Tập dữ liệu tự động tải xuống (11,3 MB) từ các tài nguyên GitHub của Ultralytics trong lần đầu tiên bạn huấn luyện với data="signature.yaml" — không cần tải xuống thủ công. Để khám phá các tập dữ liệu khác, hãy duyệt detection datasets overview.

Link to this sectionTập dữ liệu Signature Detection có bao nhiêu hình ảnh và lớp?#

Tập dữ liệu Signature Detection chứa 143 ảnh huấn luyện và 35 ảnh kiểm thử — tổng cộng 178 ảnh — mỗi ảnh được gán nhãn với một lớp duy nhất, signature. Không có tệp kiểm thử riêng biệt. Xem phần Dataset Structure và cấu hình signature.yaml để biết chi tiết.

Link to this sectionLàm thế nào để huấn luyện model YOLO26n trên Signature Detection Dataset?#

Bạn có thể huấn luyện một model YOLO26n trong 100 epochs với kích thước ảnh 640 sử dụng Python hoặc CLI:

Ví dụ về Training

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Để biết thêm chi tiết, hãy tham khảo trang Training và model training tips.

Link to this sectionLàm thế nào để tôi chạy inference với một model đã được huấn luyện trên tập dữ liệu Signature Detection?#

Tải trọng số đã được tinh chỉnh của bạn và chạy prediction: