انتقل إلى المحتوى

مجموعة بيانات كشف التواقيع

This dataset focuses on detecting human written signatures within documents. It includes a variety of document types with annotated signatures, providing valuable insights for applications in document verification and fraud detection. Essential for training computer vision algorithms, this dataset aids in identifying signatures in various document formats, supporting research and practical applications in document analysis.

هيكل مجموعة البيانات

تنقسم مجموعة بيانات اكتشاف التوقيعات إلى ثلاث مجموعات فرعية:

  • مجموعة التدريب: تحتوي على 143 صورة، كل منها مع التعليقات التوضيحية المقابلة.
  • مجموعة التحقق من الصحة: تتضمن 35 صورة، كل منها مع تعليقات توضيحية مزدوجة.

التطبيقات

يمكن تطبيق مجموعة البيانات هذه في العديد من مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتتبع الأجسام وتحليل المستندات. وعلى وجه التحديد، يمكن استخدامها لتدريب وتقييم نماذج لتحديد التواقيع في المستندات، والتي يمكن أن يكون لها تطبيقات في التحقق من المستندات، والكشف عن الاحتيال، وأبحاث الأرشيف. بالإضافة إلى ذلك، يمكن أن تكون بمثابة مورد قيّم للأغراض التعليمية، مما يمكّن الطلاب والباحثين من دراسة وفهم خصائص وسلوكيات التوقيعات في أنواع مختلفة من المستندات.

مجموعة البيانات YAML

يحدد ملف YAML (لغة ترميز أخرى) تكوين مجموعة البيانات، بما في ذلك معلومات المسارات والفئات. بالنسبة لمجموعة بيانات الكشف عن التوقيع، فإن signature.yaml يقع الملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature  ← downloads here (11.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

استخدام

To train a YOLO11n model on the signature detection dataset for 100 epochs with an image size of 640, use the provided code samples. For a comprehensive list of available parameters, refer to the model's Training page.

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

مثال على الاستدلال

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

عينة من الصور والتعليقات التوضيحية

تضم مجموعة بيانات الكشف عن التوقيعات مجموعة متنوعة من الصور التي تعرض أنواعًا مختلفة من المستندات والتوقيعات المشروحة. فيما يلي أمثلة لصور من مجموعة البيانات، كل منها مصحوبة بشروحها التوضيحية المقابلة.

صورة نموذج مجموعة بيانات كشف التواقيع

  • الصور الفسيفسائية: نقدم هنا دفعة تدريبية تتكون من صور مجموعة بيانات موزّعة بالفسيفساء. الفسيفساء، وهي تقنية تدريب، تدمج صورًا متعددة في صورة واحدة، مما يثري تنوع الدُفعات. تساعد هذه الطريقة في تعزيز قدرة النموذج على التعميم عبر مختلف أحجام التواقيع ونسب الأبعاد والسياقات.

يوضح هذا المثال تنوّع وتعقيد الصور في مجموعة بيانات الكشف عن التواقيع مع التأكيد على فوائد تضمين الفسيفساء أثناء عملية التدريب.

الاستشهادات والشكر

تم إصدار مجموعة البيانات المتاحة تحت AGPL-3.0 الترخيص.

الأسئلة المتداولة

ما هي مجموعة بيانات كشف التواقيع وكيف يمكن استخدامها؟

The Signature Detection Dataset is a collection of annotated images aimed at detecting human signatures within various document types. It can be applied in computer vision tasks such as object detection and tracking, primarily for document verification, fraud detection, and archival research. This dataset helps train models to recognize signatures in different contexts, making it valuable for both research and practical applications.

How do I train a YOLO11n model on the Signature Detection Dataset?

To train a YOLO11n model on the Signature Detection Dataset, follow these steps:

  1. قم بتنزيل signature.yaml ملف تكوين مجموعة البيانات من توقيع.yaml.
  2. استخدم البرنامج النصي التالي Python أو الأمر CLI لبدء التدريب:

مثال القطار

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

لمزيد من التفاصيل، راجع صفحة التدريب.

ما هي التطبيقات الرئيسية لمجموعة بيانات كشف التواقيع؟

يمكن استخدام مجموعة بيانات اكتشاف التواقيع من أجل:

  1. التحقق من المستندات: التحقق تلقائياً من وجود وصحة التوقيعات البشرية في المستندات.
  2. كشف الاحتيال: تحديد التوقيعات المزورة أو المزيفة في المستندات القانونية والمالية.
  3. البحوث الأرشيفية: مساعدة المؤرخين وأمناء الأرشيف في التحليل الرقمي وفهرسة الوثائق التاريخية.
  4. Education: Supporting academic research and teaching in the fields of computer vision and machine learning.

كيف يمكنني إجراء الاستدلال باستخدام نموذج مُدرَّب على مجموعة بيانات اكتشاف التواقيع؟

لإجراء الاستدلال باستخدام نموذج مُدرَّب على مجموعة بيانات كشف التوقيع، اتبع الخطوات التالية:

  1. قم بتحميل نموذجك المضبوط بدقة.
  2. استخدم البرنامج النصي Python أدناه أو الأمر CLI لإجراء الاستدلال:

مثال على الاستدلال

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

ما هي بنية مجموعة بيانات كشف التوقيع، وأين يمكنني العثور على مزيد من المعلومات؟

تنقسم مجموعة بيانات اكتشاف التواقيع إلى مجموعتين فرعيتين:

  • مجموعة التدريب: تحتوي على 143 صورة مع تعليقات توضيحية.
  • مجموعة التحقق من الصحة: تتضمن 35 صورة مع تعليقات توضيحية.

للحصول على معلومات مفصلة، يمكنك الرجوع إلى هيكل مجموعة البيانات القسم. بالإضافة إلى ذلك، يمكنك عرض تكوين مجموعة البيانات الكاملة في قسم signature.yaml الموجود على توقيع.yaml.


📅 Created 4 months ago ✏️ Updated 6 days ago

التعليقات