Link to this sectionمجموعة بيانات الكشف عن التوقيعات#
تركز مجموعة البيانات هذه على اكتشاف التوقيعات المكتوبة بخط اليد داخل المستندات. وهي تتضمن مجموعة متنوعة من أنواع المستندات التي تحتوي على توقيعات معلّقة، مما يوفر رؤى قيمة للتطبيقات في التحقق من المستندات والكشف عن الاحتيال. تُعد هذه المجموعة ضرورية لتدريب خوارزميات الرؤية الحاسوبية، حيث تساعد في تحديد التوقيعات بتنسيقات مستندات مختلفة، مما يدعم البحث والتطبيقات العملية في تحليل المستندات.
Link to this sectionهيكل مجموعة البيانات#
تم تقسيم مجموعة بيانات الكشف عن التوقيعات إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة، كل منها مع التوصيفات (annotations) المقابلة لها.
- مجموعة التحقق: تتضمن 35 صورة، كل منها مع التوصيفات المقترنة بها.
Link to this sectionالتطبيقات#
يمكن تطبيق هذه المجموعة من البيانات في العديد من مهام الرؤية الحاسوبية مثل object detection و object tracking وتحليل المستندات. وتحديداً، يمكن استخدامها لتدريب وتقييم نماذج لتحديد التوقيعات في المستندات، وهو ما له تطبيقات هامة في:
- التحقق من المستندات: أتمتة عملية التحقق للمستندات القانونية والمالية
- الكشف عن الاحتيال: تحديد التوقيعات المزورة أو غير المصرح بها
- معالجة المستندات الرقمية: تبسيط سير العمل في القطاعات الإدارية والقانونية
- المصارف والتمويل: تعزيز الأمان في معالجة الشيكات والتحقق من مستندات القروض
- البحث الأرشيفي: دعم تحليل المستندات التاريخية وفهرستها
بالإضافة إلى ذلك، تُعد مورداً قيماً للأغراض التعليمية، حيث تمكّن الطلاب والباحثين من دراسة خصائص التوقيع عبر أنواع مختلفة من المستندات.
Link to this sectionYAML مجموعة البيانات#
يحدد ملف YAML (Yet Another Markup Language) تكوين مجموعة البيانات، بما في ذلك المسارات ومعلومات الفئات. بالنسبة لمجموعة بيانات الكشف عن التوقيعات، يقع ملف signature.yaml في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zipLink to this sectionالاستخدام#
لتدريب نموذج YOLO26n على مجموعة بيانات الكشف عن التوقيعات لمدة 100 حقبة بحجم صورة 640، استخدم نماذج الأكواد المقدمة. للحصول على قائمة شاملة بالمعلمات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this sectionصور وشروحات توضيحية عينة#
تتكون مجموعة بيانات الكشف عن التوقيعات من مجموعة واسعة من الصور التي تعرض أنواعاً مختلفة من المستندات والتوقيعات الموصوفة. فيما يلي أمثلة لصور من مجموعة البيانات، كل منها مصحوبة بتوصيفاتها المقابلة.

- صورة مفسفسة (Mosaiced Image): هنا، نقدم دفعة تدريب تتكون من صور مجموعة بيانات مفسفسة. التفسيف (Mosaicing)، وهو تقنية تدريب، يجمع صوراً متعددة في صورة واحدة، مما يثري تنوع الدفعة. تساعد هذه الطريقة في تعزيز قدرة النموذج على التعميم عبر أحجام التوقيع المختلفة، ونسب العرض إلى الارتفاع، والسياقات.
يوضح هذا المثال تنوع وتعقيد الصور في مجموعة بيانات الكشف عن التوقيعات، مع التأكيد على فوائد تضمين التفسيف أثناء عملية التدريب.
Link to this sectionالاقتباسات والشكر#
تم إصدار مجموعة البيانات بموجب رخصة AGPL-3.0.
Link to this sectionالأسئلة الشائعة#
Link to this sectionما هي مجموعة بيانات الكشف عن التوقيعات، وكيف يمكن استخدامها؟#
مجموعة بيانات الكشف عن التوقيعات هي مجموعة من الصور الموصوفة التي تهدف إلى الكشف عن التوقيعات البشرية داخل أنواع مختلفة من المستندات. يمكن تطبيقها في مهام الرؤية الحاسوبية مثل اكتشاف الكائنات والتتبع، وبشكل أساسي للتحقق من المستندات، والكشف عن الاحتيال، والبحث الأرشيفي. تساعد مجموعة البيانات هذه في تدريب النماذج للتعرف على التوقيعات في سياقات مختلفة، مما يجعلها قيّمة لكل من الأبحاث والتطبيقات العملية في تحليل المستندات الذكي.
Link to this sectionكيف يمكنني تدريب نموذج YOLO26n على مجموعة بيانات الكشف عن التوقيعات؟#
لتدريب نموذج YOLO26n على مجموعة بيانات الكشف عن التوقيعات، اتبع الخطوات التالية:
- قم بتنزيل ملف تكوين مجموعة البيانات
signature.yamlمن signature.yaml. - استخدم سكربت Python أو أمر CLI التالي لبدء التدريب:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)لمزيد من التفاصيل، راجع صفحة التدريب.
Link to this sectionما هي التطبيقات الرئيسية لمجموعة بيانات الكشف عن التوقيعات؟#
يمكن استخدام مجموعة بيانات الكشف عن التوقيعات في:
- التحقق من المستندات: التحقق تلقائياً من وجود وصحة التوقيعات البشرية في المستندات.
- الكشف عن الاحتيال: تحديد التوقيعات المزورة أو الاحتيالية في المستندات القانونية والمالية.
- البحث الأرشيفي: مساعدة المؤرخين وأمناء الأرشيف في التحليل الرقمي وفهرسة المستندات التاريخية.
- التعليم: دعم البحث الأكاديمي والتدريس في مجالات الرؤية الحاسوبية والتعلم الآلي.
- الخدمات المالية: تعزيز الأمان في المعاملات المصرفية ومعالجة القروض من خلال التحقق من صحة التوقيع.
Link to this sectionكيف يمكنني إجراء الاستنتاج (inference) باستخدام نموذج مدرب على مجموعة بيانات الكشف عن التوقيعات؟#
لإجراء الاستنتاج باستخدام نموذج مدرب على مجموعة بيانات الكشف عن التوقيعات، اتبع الخطوات التالية:
- قم بتحميل النموذج الذي قمت بضبطه (fine-tuned model).
- استخدم سكربت Python أو أمر CLI أدناه لإجراء الاستنتاج:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)Link to this sectionما هو هيكل مجموعة بيانات الكشف عن التوقيعات، وأين يمكنني العثور على مزيد من المعلومات؟#
تنقسم مجموعة بيانات الكشف عن التوقيعات إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة مع التوصيفات.
- مجموعة التحقق: تتضمن 35 صورة مع التوصيفات.
للحصول على معلومات مفصلة، يمكنك الرجوع إلى قسم هيكل مجموعة البيانات. بالإضافة إلى ذلك، اعرض تكوين مجموعة البيانات الكامل في ملف signature.yaml الموجود في signature.yaml.