Bỏ qua nội dung

Bộ dữ liệu phát hiện chữ ký

Bộ dữ liệu này tập trung vào việc phát hiện chữ ký do con người viết trong tài liệu. Nó bao gồm nhiều loại tài liệu có chữ ký được chú thích, cung cấp thông tin chi tiết có giá trị cho các ứng dụng trong xác minh tài liệu và phát hiện gian lận. Thiết yếu để đào tạo các thuật toán thị giác máy tính , bộ dữ liệu này hỗ trợ xác định chữ ký trong nhiều định dạng tài liệu khác nhau, hỗ trợ nghiên cứu và ứng dụng thực tế trong phân tích tài liệu.

Cấu trúc tập dữ liệu

Bộ dữ liệu phát hiện chữ ký được chia thành ba tập con:

  • Bộ đào tạo : Bao gồm 143 hình ảnh, mỗi hình ảnh có chú thích tương ứng.
  • Bộ xác thực : Bao gồm 35 hình ảnh, mỗi hình ảnh có chú thích kèm theo.

Ứng dụng

Bộ dữ liệu này có thể được áp dụng trong nhiều tác vụ thị giác máy tính khác nhau như phát hiện đối tượng, theo dõi đối tượng và phân tích tài liệu. Cụ thể, nó có thể được sử dụng để đào tạo và đánh giá các mô hình để xác định chữ ký trong tài liệu, có thể có ứng dụng trong xác minh tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Ngoài ra, nó có thể đóng vai trò là nguồn tài nguyên có giá trị cho mục đích giáo dục, cho phép sinh viên và nhà nghiên cứu nghiên cứu và hiểu các đặc điểm và hành vi của chữ ký trong các loại tài liệu khác nhau.

Bộ dữ liệu YAML

Tệp YAML (Yet Another Markup Language) định nghĩa cấu hình tập dữ liệu, bao gồm thông tin về đường dẫn và lớp. Đối với tập dữ liệu phát hiện chữ ký, signature.yaml tập tin được đặt tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics /cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Cách sử dụng

Để đào tạo mô hình YOLO11n trên tập dữ liệu phát hiện chữ ký cho 100 kỷ nguyên với kích thước hình ảnh là 640, hãy sử dụng các mẫu mã được cung cấp. Để biết danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Đào tạo của mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Hình ảnh mẫu và chú thích

Bộ dữ liệu phát hiện chữ ký bao gồm nhiều hình ảnh khác nhau thể hiện các loại tài liệu khác nhau và chữ ký có chú thích. Dưới đây là ví dụ về hình ảnh từ bộ dữ liệu, mỗi hình ảnh đi kèm với chú thích tương ứng.

Hình ảnh mẫu tập dữ liệu phát hiện chữ ký

  • Mosaiced Image : Tại đây, chúng tôi trình bày một lô đào tạo bao gồm các hình ảnh tập dữ liệu mosaic. Mosaicing, một kỹ thuật đào tạo, kết hợp nhiều hình ảnh thành một, làm phong phú thêm tính đa dạng của lô. Phương pháp này giúp tăng cường khả năng khái quát hóa của mô hình trên các kích thước chữ ký, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này minh họa sự đa dạng và phức tạp của hình ảnh trong Bộ dữ liệu phát hiện chữ ký, nhấn mạnh lợi ích của việc đưa khảm vào trong quá trình đào tạo.

Trích dẫn và Lời cảm ơn

Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0 .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu phát hiện chữ ký là gì và có thể sử dụng nó như thế nào?

Signature Detection Dataset là tập hợp các hình ảnh có chú thích nhằm mục đích phát hiện chữ ký của con người trong nhiều loại tài liệu khác nhau. Nó có thể được áp dụng trong các tác vụ thị giác máy tính như phát hiện và theo dõi đối tượng , chủ yếu để xác minh tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Tập dữ liệu này giúp đào tạo các mô hình để nhận dạng chữ ký trong các bối cảnh khác nhau, khiến nó có giá trị cho cả nghiên cứu và ứng dụng thực tế.

Làm thế nào để đào tạo mô hình YOLO11n trên Bộ dữ liệu phát hiện chữ ký?

Để đào tạo mô hình YOLO11n trên Bộ dữ liệu phát hiện chữ ký, hãy làm theo các bước sau:

  1. Tải xuống signature.yaml tập tin cấu hình tập dữ liệu từ chữ ký.yaml.
  2. Sử dụng những điều sau đây Python kịch bản hoặc CLI lệnh để bắt đầu đào tạo:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Để biết thêm chi tiết, hãy tham khảo trang Đào tạo .

Ứng dụng chính của Bộ dữ liệu phát hiện chữ ký là gì?

Bộ dữ liệu phát hiện chữ ký có thể được sử dụng cho:

  1. Xác minh tài liệu : Tự động xác minh sự hiện diện và tính xác thực của chữ ký của con người trong tài liệu.
  2. Phát hiện gian lận : Xác định chữ ký giả mạo hoặc gian lận trong các tài liệu pháp lý và tài chính.
  3. Nghiên cứu lưu trữ : Hỗ trợ các nhà sử học và lưu trữ trong việc phân tích kỹ thuật số và lập danh mục các tài liệu lịch sử.
  4. Giáo dục : Hỗ trợ nghiên cứu học thuật và giảng dạy trong lĩnh vực thị giác máy tính và học máy .

Tôi có thể thực hiện suy luận bằng cách sử dụng mô hình được đào tạo trên Bộ dữ liệu phát hiện chữ ký như thế nào?

Để thực hiện suy luận bằng cách sử dụng mô hình được đào tạo trên Bộ dữ liệu phát hiện chữ ký, hãy làm theo các bước sau:

  1. Tải mô hình đã tinh chỉnh của bạn.
  2. Sử dụng bên dưới Python kịch bản hoặc CLI lệnh thực hiện suy luận:

Ví dụ suy luận

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Cấu trúc của Bộ dữ liệu phát hiện chữ ký là gì và tôi có thể tìm thêm thông tin ở đâu?

Bộ dữ liệu phát hiện chữ ký được chia thành hai tập hợp con:

  • Bộ đào tạo : Bao gồm 143 hình ảnh có chú thích.
  • Bộ xác thực : Bao gồm 35 hình ảnh có chú thích.

Để biết thông tin chi tiết, bạn có thể tham khảo Cấu trúc tập dữ liệu phần. Ngoài ra, hãy xem cấu hình tập dữ liệu đầy đủ trong signature.yaml tập tin nằm ở chữ ký.yaml.

📅 Được tạo ra cách đây 6 tháng ✏️ Đã cập nhật cách đây 2 tháng

Bình luận