مجموعة بيانات كشف التوقيعات
تركز مجموعة البيانات هذه على كشف التوقيعات البشرية المكتوبة داخل المستندات. وهي تتضمن مجموعة متنوعة من أنواع المستندات التي تحتوي على توقيعات مشروحة، مما يوفر رؤى قيمة للتطبيقات في التحقق من المستندات وكشف الاحتيال. وتعد هذه المجموعة ضرورية لتدريب خوارزميات الرؤية الحاسوبية، كما تساعد في التعرف على التوقيعات في تنسيقات مستندات مختلفة، مما يدعم البحث والتطبيقات العملية في تحليل المستندات.
هيكل مجموعة البيانات
تم تقسيم مجموعة بيانات كشف التوقيعات إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة، كل منها مصحوبة بشروحات مقابلة لها.
- مجموعة التحقق: تتضمن 35 صورة، كل منها مصحوبة بشروحات زوجية.
التطبيقات
يمكن تطبيق مجموعة البيانات هذه في مهام رؤية حاسوبية متنوعة مثل كشف الأجسام وتتبع الأجسام وتحليل المستندات. وتحديداً، يمكن استخدامها لتدريب وتقييم النماذج للتعرف على التوقيعات في المستندات، وهو ما له تطبيقات مهمة في:
- التحقق من المستندات: أتمتة عملية التحقق من المستندات القانونية والمالية
- كشف الاحتيال: التعرف على التوقيعات المزورة أو غير المصرح بها
- معالجة المستندات الرقمية: تبسيط سير العمل في القطاعات الإدارية والقانونية
- المصارف والتمويل: تعزيز الأمان في معالجة الشيكات والتحقق من مستندات القروض
- البحث الأرشيفي: دعم تحليل وفهرسة الوثائق التاريخية
بالإضافة إلى ذلك، تُعد مورداً قيماً للأغراض التعليمية، مما يتيح للطلاب والباحثين دراسة خصائص التوقيعات عبر أنواع مختلفة من المستندات.
ملف YAML الخاص بمجموعة البيانات
يحدد ملف YAML (Yet Another Markup Language) تكوين مجموعة البيانات، بما في ذلك المسارات ومعلومات الفئات. بالنسبة لمجموعة بيانات كشف التوقيعات، يقع ملف signature.yaml في الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipالاستخدام
لتدريب نموذج YOLO26n على مجموعة بيانات كشف التوقيعات لمدة 100 حقبة بحجم صورة 640، استخدم نماذج الأكواد المقدمة. للحصول على قائمة شاملة بالمعلمات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)صور وعينات تعليقات توضيحية
تتكون مجموعة بيانات كشف التوقيعات من مجموعة واسعة من الصور التي تعرض أنواعاً مختلفة من المستندات والتوقيعات المشروحة. فيما يلي أمثلة لصور من مجموعة البيانات، كل منها مصحوبة بشروحاتها المقابلة.

- صورة فسيفسائية: نقدم هنا دفعة تدريب تتكون من صور مجموعة بيانات مجمعة بتنسيق فسيفسائي. تعد الفسيفساء (Mosaicing)، وهي تقنية تدريب، تدمج صوراً متعددة في صورة واحدة، مما يثري تنوع الدفعة. تساعد هذه الطريقة في تعزيز قدرة النموذج على التعميم عبر أحجام التوقيعات ونسب العرض إلى الارتفاع والسياقات المختلفة.
يوضح هذا المثال تنوع وتعقيد الصور في مجموعة بيانات كشف التوقيعات، مع التأكيد على فوائد تضمين الفسيفساء أثناء عملية التدريب.
الاقتباسات والشكر
تم إصدار مجموعة البيانات بموجب رخصة AGPL-3.0.
الأسئلة الشائعة
ما هي مجموعة بيانات كشف التوقيعات، وكيف يمكن استخدامها؟
مجموعة بيانات كشف التوقيعات هي مجموعة من الصور المشروحة تهدف إلى كشف التوقيعات البشرية داخل أنواع مختلفة من المستندات. يمكن تطبيقها في مهام الرؤية الحاسوبية مثل كشف الأجسام والتتبع، وبشكل أساسي للتحقق من المستندات وكشف الاحتيال والبحث الأرشيفي. تساعد مجموعة البيانات هذه في تدريب النماذج على التعرف على التوقيعات في سياقات مختلفة، مما يجعلها قيمة لكل من الأبحاث والتطبيقات العملية في تحليل المستندات الذكي.
كيف يمكنني تدريب نموذج YOLO26n على مجموعة بيانات كشف التوقيعات؟
لتدريب نموذج YOLO26n على مجموعة بيانات كشف التوقيعات، اتبع الخطوات التالية:
- قم بتنزيل ملف تكوين مجموعة البيانات
signature.yamlمن الرابط signature.yaml. - استخدم سكربت Python أو أمر CLI التالي لبدء التدريب:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)لمزيد من التفاصيل، راجع صفحة التدريب.
ما هي التطبيقات الرئيسية لمجموعة بيانات كشف التوقيعات؟
يمكن استخدام مجموعة بيانات كشف التوقيعات في:
- التحقق من المستندات: التحقق تلقائياً من وجود وصحة التوقيعات البشرية في المستندات.
- كشف الاحتيال: التعرف على التوقيعات المزورة أو الاحتيالية في المستندات القانونية والمالية.
- البحث الأرشيفي: مساعدة المؤرخين وأمناء الأرشيف في التحليل الرقمي وفهرسة الوثائق التاريخية.
- التعليم: دعم البحث الأكاديمي والتدريس في مجالات الرؤية الحاسوبية والتعلم الآلي.
- الخدمات المالية: تعزيز الأمان في المعاملات المصرفية ومعالجة القروض من خلال التحقق من صحة التوقيع.
كيف يمكنني إجراء الاستدلال باستخدام نموذج تم تدريبه على مجموعة بيانات كشف التوقيعات؟
لإجراء الاستدلال باستخدام نموذج تم تدريبه على مجموعة بيانات كشف التوقيعات، اتبع الخطوات التالية:
- قم بتحميل النموذج الذي تم ضبطه بدقة (fine-tuned).
- استخدم سكربت Python أو أمر CLI أدناه لإجراء الاستدلال:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)ما هي بنية مجموعة بيانات كشف التوقيعات، وأين يمكنني العثور على مزيد من المعلومات؟
تم تقسيم مجموعة بيانات كشف التوقيعات إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة مع شروحات.
- مجموعة التحقق: تتضمن 35 صورة مع شروحات.
للحصول على معلومات مفصلة، يمكنك الرجوع إلى قسم بنية مجموعة البيانات. بالإضافة إلى ذلك، يمكنك عرض تكوين مجموعة البيانات بالكامل في ملف signature.yaml الموجود على الرابط signature.yaml.