Tập dữ liệu nhận diện chữ ký

Tập dữ liệu này tập trung vào việc nhận diện các chữ ký tay của con người trong các tài liệu. Nó bao gồm nhiều loại tài liệu với các chữ ký đã được chú thích, cung cấp thông tin giá trị cho các ứng dụng xác thực tài liệu và phát hiện gian lận. Là yếu tố thiết yếu để huấn luyện các thuật toán computer vision, tập dữ liệu này hỗ trợ việc nhận diện chữ ký trong nhiều định dạng tài liệu khác nhau, hỗ trợ nghiên cứu và các ứng dụng thực tế trong phân tích tài liệu.

Cấu trúc tập dữ liệu

Tập dữ liệu nhận diện chữ ký được chia thành hai tập hợp con:

  • Tập huấn luyện (Training set): Chứa 143 hình ảnh, mỗi hình ảnh đi kèm với chú thích tương ứng.
  • Tập kiểm thử (Validation set): Bao gồm 35 hình ảnh, mỗi hình ảnh đi kèm với các chú thích tương ứng.

Ứng dụng

Tập dữ liệu này có thể được áp dụng trong nhiều tác vụ computer vision như object detection, object tracking và phân tích tài liệu. Cụ thể, nó có thể được sử dụng để huấn luyện và đánh giá các model nhận diện chữ ký trong tài liệu, mang lại ứng dụng quan trọng trong:

  • Xác thực tài liệu: Tự động hóa quy trình xác thực cho các tài liệu pháp lý và tài chính
  • Phát hiện gian lận: Nhận diện các chữ ký có khả năng là giả mạo hoặc trái phép
  • Xử lý tài liệu kỹ thuật số: Tối ưu hóa quy trình làm việc trong các lĩnh vực hành chính và pháp lý
  • Ngân hàng và Tài chính: Tăng cường bảo mật trong quy trình xử lý séc và xác thực tài liệu khoản vay
  • Nghiên cứu lưu trữ: Hỗ trợ phân tích và lập danh mục tài liệu lịch sử

Ngoài ra, đây còn là nguồn tài nguyên giá trị cho mục đích giáo dục, cho phép sinh viên và các nhà nghiên cứu tìm hiểu về đặc điểm chữ ký qua các loại tài liệu khác nhau.

Dataset YAML

Một tệp YAML (Yet Another Markup Language) định nghĩa cấu hình tập dữ liệu, bao gồm các đường dẫn và thông tin lớp. Đối với tập dữ liệu nhận diện chữ ký, tệp signature.yaml nằm tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Cách sử dụng

Để huấn luyện model YOLO26n trên tập dữ liệu nhận diện chữ ký trong 100 epochs với kích thước hình ảnh là 640, hãy sử dụng các đoạn mã được cung cấp. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Training của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
Ví dụ suy luận
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Hình ảnh và chú thích mẫu

Tập dữ liệu nhận diện chữ ký bao gồm nhiều hình ảnh đa dạng thể hiện các loại tài liệu khác nhau và các chữ ký đã được chú thích. Dưới đây là các ví dụ về hình ảnh từ tập dữ liệu, mỗi hình ảnh đi kèm với chú thích tương ứng.

Hình ảnh mẫu từ tập dữ liệu nhận diện chữ ký

  • Hình ảnh Mosaiced: Tại đây, chúng tôi trình bày một lô (batch) huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic, một kỹ thuật huấn luyện, kết hợp nhiều hình ảnh thành một, làm phong phú sự đa dạng của lô dữ liệu. Phương pháp này giúp nâng cao khả năng tổng quát hóa của model đối với các kích thước, tỷ lệ khung hình và ngữ cảnh chữ ký khác nhau.

Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong Tập dữ liệu nhận diện chữ ký, nhấn mạnh lợi ích của việc bao gồm kỹ thuật Mosaic trong quá trình huấn luyện.

Trích dẫn và Ghi nhận

Tập dữ liệu đã được phát hành theo AGPL-3.0 License.

Câu hỏi thường gặp (FAQ)

Tập dữ liệu nhận diện chữ ký là gì và làm thế nào để sử dụng nó?

Tập dữ liệu nhận diện chữ ký là một bộ sưu tập các hình ảnh đã được chú thích nhằm mục đích phát hiện chữ ký của con người trong các loại tài liệu khác nhau. Nó có thể được áp dụng trong các tác vụ computer vision như object detection và tracking, chủ yếu để xác thực tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Tập dữ liệu này giúp huấn luyện các model nhận diện chữ ký trong nhiều ngữ cảnh khác nhau, khiến nó trở nên giá trị cho cả nghiên cứu và các ứng dụng thực tế trong smart document analysis.

Làm cách nào để huấn luyện model YOLO26n trên Tập dữ liệu nhận diện chữ ký?

Để huấn luyện model YOLO26n trên Tập dữ liệu nhận diện chữ ký, hãy làm theo các bước sau:

  1. Tải xuống tệp cấu hình tập dữ liệu signature.yaml từ signature.yaml.
  2. Sử dụng script Python hoặc lệnh CLI sau đây để bắt đầu huấn luyện:
Ví dụ huấn luyện
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

Để biết thêm chi tiết, hãy tham khảo trang Training.

Các ứng dụng chính của Tập dữ liệu nhận diện chữ ký là gì?

Tập dữ liệu nhận diện chữ ký có thể được sử dụng cho:

  1. Xác thực tài liệu: Tự động xác thực sự hiện diện và tính xác thực của chữ ký con người trong tài liệu.
  2. Phát hiện gian lận: Nhận diện các chữ ký giả mạo hoặc gian lận trong các tài liệu pháp lý và tài chính.
  3. Nghiên cứu lưu trữ: Hỗ trợ các nhà sử học và lưu trữ trong việc phân tích kỹ thuật số và lập danh mục các tài liệu lịch sử.
  4. Giáo dục: Hỗ trợ nghiên cứu học thuật và giảng dạy trong lĩnh vực computer vision và machine learning.
  5. Dịch vụ tài chính: Tăng cường bảo mật trong giao dịch ngân hàng và xử lý khoản vay bằng cách xác thực tính chân thực của chữ ký.

Làm cách nào để thực hiện inference bằng model đã được huấn luyện trên Tập dữ liệu nhận diện chữ ký?

Để thực hiện inference bằng model đã được huấn luyện trên Tập dữ liệu nhận diện chữ ký, hãy làm theo các bước sau:

  1. Tải model đã được tinh chỉnh (fine-tuned) của bạn.
  2. Sử dụng script Python hoặc lệnh CLI dưới đây để thực hiện inference:
Ví dụ suy luận
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

Cấu trúc của Tập dữ liệu nhận diện chữ ký là gì và tôi có thể tìm thêm thông tin ở đâu?

Tập dữ liệu nhận diện chữ ký được chia thành hai tập hợp con:

  • Tập huấn luyện (Training Set): Chứa 143 hình ảnh với các chú thích.
  • Tập kiểm thử (Validation Set): Bao gồm 35 hình ảnh với các chú thích.

Để biết thông tin chi tiết, bạn có thể tham khảo mục Dataset Structure. Ngoài ra, hãy xem cấu hình tập dữ liệu hoàn chỉnh trong tệp signature.yaml tại signature.yaml.

Bình luận