Bỏ để qua phần nội dung

Tập dữ liệu phát hiện chữ ký

Bộ dữ liệu này tập trung vào việc phát hiện chữ ký bằng văn bản của con người trong các tài liệu. Nó bao gồm nhiều loại tài liệu với chữ ký được chú thích, cung cấp thông tin chi tiết có giá trị cho các ứng dụng trong xác minh tài liệu và phát hiện gian lận. Cần thiết cho việc đào tạo các thuật toán thị giác máy tính, bộ dữ liệu này hỗ trợ xác định chữ ký ở các định dạng tài liệu khác nhau, hỗ trợ nghiên cứu và ứng dụng thực tế trong phân tích tài liệu.

Cấu trúc tập dữ liệu

Tập dữ liệu phát hiện chữ ký được chia thành ba tập hợp con:

  • Bộ đào tạo: Chứa 143 hình ảnh, mỗi hình ảnh có chú thích tương ứng.
  • Bộ xác thực: Bao gồm 35 hình ảnh, mỗi hình ảnh có chú thích được ghép nối.

Ứng dụng

Tập dữ liệu này có thể được áp dụng trong các tác vụ thị giác máy tính khác nhau như phát hiện đối tượng, theo dõi đối tượng và phân tích tài liệu. Cụ thể, nó có thể được sử dụng để đào tạo và đánh giá các mô hình xác định chữ ký trong tài liệu, có thể có các ứng dụng trong xác minh tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Ngoài ra, nó có thể phục vụ như một nguồn tài nguyên có giá trị cho mục đích giáo dục, cho phép sinh viên và nhà nghiên cứu nghiên cứu và hiểu các đặc điểm và hành vi của chữ ký trong các loại tài liệu khác nhau.

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) xác định cấu hình tập dữ liệu, bao gồm thông tin đường dẫn và lớp. Đối với tập dữ liệu phát hiện chữ ký, signature.yaml tập tin được đặt tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://ultralytics.com/assets/signature.zip

Sử dụng

Để đào tạo một YOLOv8n Mô hình trên tập dữ liệu phát hiện chữ ký cho 100 kỷ nguyên với kích thước hình ảnh là 640, sử dụng các mẫu mã được cung cấp. Để biết danh sách đầy đủ các thông số có sẵn, hãy tham khảo trang Đào tạo của mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolov8n.pt epochs=100 imgsz=640

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Hình ảnh mẫu và chú thích

Bộ dữ liệu phát hiện chữ ký bao gồm nhiều hình ảnh hiển thị các loại tài liệu khác nhau và chữ ký được chú thích. Dưới đây là ví dụ về hình ảnh từ tập dữ liệu, mỗi hình ảnh đi kèm với các chú thích tương ứng của nó.

Hình ảnh mẫu tập dữ liệu phát hiện chữ ký

  • Hình ảnh khảm: Ở đây, chúng tôi trình bày một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm, một kỹ thuật đào tạo, kết hợp nhiều hình ảnh thành một, làm phong phú thêm sự đa dạng hàng loạt. Phương pháp này giúp nâng cao khả năng khái quát hóa của mô hình trên các kích thước chữ ký, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này minh họa sự đa dạng và phức tạp của hình ảnh trong Tập dữ liệu phát hiện chữ ký, nhấn mạnh lợi ích của việc bao gồm khảm trong quá trình đào tạo.

Trích dẫn và xác nhận

Tập dữ liệu đã được phát hành có sẵn theo AGPL-3.0 Giấy phép.



Created 2024-05-22, Updated 2024-06-02
Authors: glenn-jocher (1), RizwanMunawar (1)

Ý kiến