Chuyển đến nội dung

Bộ dữ liệu phát hiện chữ ký

Bộ dữ liệu này tập trung vào việc phát hiện chữ ký viết tay của con người trong tài liệu. Nó bao gồm nhiều loại tài liệu khác nhau với các chữ ký được chú thích, cung cấp những hiểu biết có giá trị cho các ứng dụng trong xác minh tài liệu và phát hiện gian lận. Cần thiết cho việc đào tạo các thuật toán thị giác máy tính, bộ dữ liệu này hỗ trợ xác định chữ ký trong các định dạng tài liệu khác nhau, hỗ trợ nghiên cứu và các ứng dụng thực tế trong phân tích tài liệu.

Cấu trúc bộ dữ liệu

Bộ dữ liệu phát hiện chữ ký được chia thành hai tập hợp con:

  • Tập huấn luyện: Chứa 143 hình ảnh, mỗi hình ảnh có các chú thích tương ứng.
  • Tập hợp xác thực: Bao gồm 35 hình ảnh, mỗi hình ảnh có các chú thích được ghép nối.

Các ứng dụng

Bộ dữ liệu này có thể được áp dụng trong nhiều tác vụ thị giác máy tính khác nhau, chẳng hạn như phát hiện đối tượng, theo dõi đối tượng và phân tích tài liệu. Cụ thể, nó có thể được sử dụng để huấn luyện và đánh giá các mô hình để xác định chữ ký trong tài liệu, điều này có các ứng dụng quan trọng trong:

  • Xác minh tài liệu: Tự động hóa quy trình xác minh cho các tài liệu pháp lý và tài chính
  • Phát hiện Gian lận: Xác định các chữ ký có khả năng bị giả mạo hoặc không được phép
  • Xử lý tài liệu số: Tối ưu hóa quy trình làm việc trong các lĩnh vực hành chính và pháp lý
  • Ngân hàng và Tài chính: Nâng cao bảo mật trong xử lý séc và xác minh tài liệu cho vay
  • Nghiên cứu Lưu trữ: Hỗ trợ phân tích và lập danh mục tài liệu lịch sử

Ngoài ra, nó đóng vai trò như một nguồn tài nguyên có giá trị cho mục đích giáo dục, cho phép sinh viên và nhà nghiên cứu nghiên cứu các đặc điểm chữ ký trên các loại tài liệu khác nhau.

YAML bộ dữ liệu

Tệp YAML (Yet Another Markup Language) xác định cấu hình bộ dữ liệu, bao gồm đường dẫn và thông tin lớp. Đối với bộ dữ liệu phát hiện chữ ký, signature.yaml tệp nằm tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Cách sử dụng

Để huấn luyện mô hình YOLO11n trên bộ dữ liệu phát hiện chữ ký trong 100 epochs với kích thước hình ảnh là 640, hãy sử dụng các mẫu code được cung cấp. Để có danh sách đầy đủ các tham số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Ảnh và Chú thích mẫu

Bộ dữ liệu phát hiện chữ ký bao gồm nhiều hình ảnh khác nhau thể hiện các loại tài liệu và chữ ký được chú thích khác nhau. Dưới đây là các ví dụ về hình ảnh từ bộ dữ liệu, mỗi hình ảnh đi kèm với các chú thích tương ứng.

Hình ảnh mẫu bộ dữ liệu phát hiện chữ ký (Signature detection dataset)

  • Mosaiced Image: Ở đây, chúng tôi trình bày một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được ghép. Mosaicing, một kỹ thuật huấn luyện, kết hợp nhiều hình ảnh thành một, làm phong phú thêm sự đa dạng của lô. Phương pháp này giúp tăng cường khả năng khái quát hóa của mô hình trên các kích thước, tỷ lệ khung hình và ngữ cảnh chữ ký khác nhau.

Ví dụ này minh họa sự đa dạng và phức tạp của hình ảnh trong Bộ dữ liệu Phát hiện Chữ ký, nhấn mạnh những lợi ích của việc đưa mosaicing vào trong quá trình huấn luyện.

Trích dẫn và Lời cảm ơn

Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.

Câu hỏi thường gặp

Tập dữ liệu Phát hiện Chữ ký là gì và nó có thể được sử dụng như thế nào?

Bộ dữ liệu phát hiện chữ ký là một tập hợp các hình ảnh được chú thích nhằm mục đích phát hiện chữ ký người trong nhiều loại tài liệu khác nhau. Nó có thể được áp dụng trong các tác vụ thị giác máy tính như phát hiện đối tượng và theo dõi, chủ yếu để xác minh tài liệu, phát hiện gian lận và nghiên cứu lưu trữ. Bộ dữ liệu này giúp đào tạo các mô hình để nhận dạng chữ ký trong các ngữ cảnh khác nhau, làm cho nó có giá trị cho cả nghiên cứu và các ứng dụng thực tế trong phân tích tài liệu thông minh.

Làm cách nào để huấn luyện mô hình YOLO11n trên Tập dữ liệu Phát hiện Chữ ký?

Để huấn luyện mô hình YOLO11n trên Bộ dữ liệu Nhận dạng Chữ ký (Signature Detection Dataset), hãy làm theo các bước sau:

  1. Tải xuống signature.yaml tệp cấu hình bộ dữ liệu từ signature.yaml.
  2. Sử dụng script python hoặc lệnh CLI sau để bắt đầu huấn luyện:

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Để biết thêm chi tiết, tham khảo trang Huấn luyện.

Các ứng dụng chính của Bộ dữ liệu phát hiện chữ ký là gì?

Bộ dữ liệu phát hiện chữ ký có thể được sử dụng cho:

  1. Xác minh Tài liệu: Tự động xác minh sự hiện diện và tính xác thực của chữ ký người trong tài liệu.
  2. Phát hiện Gian lận: Xác định chữ ký giả mạo hoặc gian lận trong các tài liệu pháp lý và tài chính.
  3. Nghiên cứu Lưu trữ: Hỗ trợ các nhà sử học và người làm công tác lưu trữ trong việc phân tích và lập danh mục kỹ thuật số các tài liệu lịch sử.
  4. Giáo dục: Hỗ trợ nghiên cứu và giảng dạy học thuật trong các lĩnh vực thị giác máy tính và học máy.
  5. Dịch vụ tài chính: Nâng cao bảo mật trong các giao dịch ngân hàng và xử lý khoản vay bằng cách xác minh tính xác thực của chữ ký.

Làm cách nào để thực hiện suy luận bằng mô hình được đào tạo trên Bộ dữ liệu phát hiện chữ ký?

Để thực hiện suy luận bằng mô hình đã được huấn luyện trên Tập dữ liệu Phát hiện Chữ ký, hãy làm theo các bước sau:

  1. Tải mô hình đã tinh chỉnh của bạn.
  2. Sử dụng script python hoặc lệnh CLI bên dưới để thực hiện suy luận:

Ví dụ về suy luận

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Cấu trúc của Bộ dữ liệu phát hiện chữ ký là gì và tôi có thể tìm thêm thông tin ở đâu?

Bộ dữ liệu Nhận dạng Chữ ký được chia thành hai tập hợp con:

  • Tập huấn luyện: Chứa 143 hình ảnh có chú thích.
  • Tập hợp xác thực: Bao gồm 35 hình ảnh có chú thích.

Để biết thông tin chi tiết, bạn có thể tham khảo Cấu trúc bộ dữ liệu phần. Ngoài ra, hãy xem cấu hình bộ dữ liệu hoàn chỉnh trong signature.yaml tệp nằm tại signature.yaml.



📅 Đã tạo 1 năm trước ✏️ Cập nhật 5 tháng trước

Bình luận