Link to this sectionTập dữ liệu Phát hiện Chữ ký#
Tập dữ liệu này tập trung vào việc phát hiện chữ ký viết tay của con người trong các tài liệu. Nó bao gồm nhiều loại tài liệu với chữ ký đã được chú thích, cung cấp thông tin chuyên sâu có giá trị cho các ứng dụng trong xác thực tài liệu và phát hiện gian lận. Là yếu tố cần thiết để huấn luyện các thuật toán computer vision, tập dữ liệu này hỗ trợ xác định chữ ký trong các định dạng tài liệu khác nhau, hỗ trợ nghiên cứu và các ứng dụng thực tế trong phân tích tài liệu.
Link to this sectionCấu trúc tập dữ liệu#
Tập dữ liệu phát hiện chữ ký được chia thành hai tập hợp con:
- Training set: Chứa 143 hình ảnh, mỗi hình ảnh có các chú thích tương ứng.
- Validation set: Bao gồm 35 hình ảnh, mỗi hình ảnh có các chú thích đi kèm.
Link to this sectionỨng dụng#
Tập dữ liệu này có thể được ứng dụng trong nhiều tác vụ thị giác máy tính khác nhau như object detection, object tracking và phân tích tài liệu. Cụ thể, nó có thể được sử dụng để huấn luyện và đánh giá các model nhằm xác định chữ ký trong tài liệu, vốn có các ứng dụng quan trọng trong:
- Document Verification: Tự động hóa quy trình xác thực cho các tài liệu pháp lý và tài chính
- Fraud Detection: Xác định các chữ ký có khả năng bị làm giả hoặc trái phép
- Digital Document Processing: Tối ưu hóa quy trình làm việc trong các lĩnh vực hành chính và pháp lý
- Banking and Finance: Tăng cường bảo mật trong xử lý séc và xác thực tài liệu vay vốn
- Archival Research: Hỗ trợ phân tích và lập danh mục tài liệu lịch sử
Ngoài ra, nó còn đóng vai trò là nguồn tài nguyên quý giá cho mục đích giáo dục, cho phép sinh viên và các nhà nghiên cứu nghiên cứu các đặc điểm chữ ký trên các loại tài liệu khác nhau.
Link to this sectionYAML tập dữ liệu#
Một tệp YAML (Yet Another Markup Language) định nghĩa cấu hình tập dữ liệu, bao gồm thông tin về đường dẫn và các lớp. Đối với tập dữ liệu phát hiện chữ ký, tệp signature.yaml nằm tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipLink to this sectionCách sử dụng#
Để huấn luyện model YOLO26n trên tập dữ liệu phát hiện chữ ký trong 100 epochs với kích thước hình ảnh là 640, hãy sử dụng các đoạn mã được cung cấp. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Training của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this sectionHình ảnh mẫu và chú thích#
Tập dữ liệu phát hiện chữ ký bao gồm nhiều loại hình ảnh đa dạng thể hiện các loại tài liệu khác nhau và các chữ ký đã được chú thích. Dưới đây là các ví dụ về hình ảnh từ tập dữ liệu, mỗi hình ảnh đều đi kèm với các chú thích tương ứng.

- Mosaiced Image: Tại đây, chúng tôi trình bày một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật mosaic. Mosaic, một kỹ thuật huấn luyện, kết hợp nhiều hình ảnh thành một, giúp làm phong phú thêm sự đa dạng của batch. Phương pháp này giúp nâng cao khả năng tổng quát hóa của model trên các kích thước chữ ký, tỷ lệ khung hình và bối cảnh khác nhau.
Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong Signature Detection Dataset, nhấn mạnh lợi ích của việc bao gồm kỹ thuật mosaic trong quá trình huấn luyện.
Link to this sectionTrích dẫn và Ghi nhận#
Tập dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionSignature Detection Dataset là gì và nó có thể được sử dụng như thế nào?#
Signature Detection Dataset là một bộ sưu tập các hình ảnh đã được chú thích nhằm mục đích phát hiện chữ ký của con người trong các loại tài liệu khác nhau. Nó có thể được áp dụng trong các tác vụ computer vision như object detection và tracking, chủ yếu để xác thực tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Tập dữ liệu này giúp huấn luyện các model nhận biết chữ ký trong các bối cảnh khác nhau, khiến nó trở nên có giá trị cho cả nghiên cứu và các ứng dụng thực tế trong smart document analysis.
Link to this sectionLàm thế nào để huấn luyện model YOLO26n trên Signature Detection Dataset?#
Để huấn luyện model YOLO26n trên Signature Detection Dataset, hãy thực hiện theo các bước sau:
- Tải xuống tệp cấu hình tập dữ liệu
signature.yamltừ signature.yaml. - Sử dụng tập lệnh Python hoặc lệnh CLI sau đây để bắt đầu huấn luyện:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)Để biết thêm chi tiết, hãy tham khảo trang Training.
Link to this sectionCác ứng dụng chính của Signature Detection Dataset là gì?#
Signature Detection Dataset có thể được sử dụng cho:
- Document Verification: Tự động xác thực sự hiện diện và tính xác thực của chữ ký con người trong tài liệu.
- Fraud Detection: Xác định các chữ ký bị làm giả hoặc gian lận trong tài liệu pháp lý và tài chính.
- Archival Research: Hỗ trợ các nhà sử học và lưu trữ trong việc phân tích kỹ thuật số và lập danh mục các tài liệu lịch sử.
- Education: Hỗ trợ nghiên cứu học thuật và giảng dạy trong lĩnh vực computer vision và machine learning.
- Financial Services: Tăng cường bảo mật trong các giao dịch ngân hàng và xử lý khoản vay bằng cách xác thực chữ ký.
Link to this sectionLàm thế nào để thực hiện inference bằng model đã được huấn luyện trên Signature Detection Dataset?#
Để thực hiện inference bằng model đã được huấn luyện trên Signature Detection Dataset, hãy thực hiện theo các bước sau:
- Tải model đã được tinh chỉnh của bạn lên.
- Sử dụng tập lệnh Python hoặc lệnh CLI dưới đây để thực hiện inference:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this sectionCấu trúc của Signature Detection Dataset như thế nào và tôi có thể tìm thêm thông tin ở đâu?#
Signature Detection Dataset được chia thành hai tập hợp con:
- Training Set: Chứa 143 hình ảnh cùng các chú thích.
- Validation Set: Bao gồm 35 hình ảnh cùng các chú thích.
Để biết thông tin chi tiết, bạn có thể tham khảo phần Dataset Structure. Ngoài ra, hãy xem cấu hình đầy đủ của tập dữ liệu trong tệp signature.yaml đặt tại signature.yaml.