مجموعة بيانات كشف التواقيع
تركز مجموعة البيانات هذه على اكتشاف التوقيعات البشرية المكتوبة داخل المستندات. وتتضمن مجموعة متنوعة من أنواع المستندات ذات التوقيعات المشروحة، مما يوفر رؤى قيمة للتطبيقات في مجال التحقق من المستندات والكشف عن الاحتيال. تساعد مجموعة البيانات هذه، وهي ضرورية لتدريب خوارزميات الرؤية الحاسوبية، في تحديد التوقيعات في مختلف تنسيقات المستندات، مما يدعم الأبحاث والتطبيقات العملية في تحليل المستندات.
هيكلية مجموعة البيانات
تنقسم مجموعة بيانات اكتشاف التوقيعات إلى ثلاث مجموعات فرعية:
- مجموعة التدريب: تحتوي على 143 صورة، كل منها مع التعليقات التوضيحية المقابلة.
- مجموعة التحقق من الصحة: تتضمن 35 صورة، كل منها مع تعليقات توضيحية مزدوجة.
التطبيقات
يمكن تطبيق مجموعة البيانات هذه في العديد من مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتتبع الأجسام وتحليل المستندات. وعلى وجه التحديد، يمكن استخدامها لتدريب وتقييم نماذج لتحديد التواقيع في المستندات، والتي يمكن أن يكون لها تطبيقات في التحقق من المستندات، والكشف عن الاحتيال، وأبحاث الأرشيف. بالإضافة إلى ذلك، يمكن أن تكون بمثابة مورد قيّم للأغراض التعليمية، مما يمكّن الطلاب والباحثين من دراسة وفهم خصائص وسلوكيات التوقيعات في أنواع مختلفة من المستندات.
مجموعة البيانات YAML
يحدد ملف YAML (لغة ترميز أخرى) تكوين مجموعة البيانات، بما في ذلك معلومات المسارات والفئات. بالنسبة لمجموعة بيانات الكشف عن التوقيع، فإن signature.yaml
يقع الملف على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/signature # dataset root dir
train: train/images # train images (relative to 'path') 143 images
val: valid/images # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
الاستخدام
لتدريب نموذج YOLO11n على مجموعة بيانات اكتشاف التوقيع لـ 100 حلقة تدريبية بحجم صورة 640، استخدم نماذج التعليمات البرمجية المتوفرة. للحصول على قائمة شاملة بالمعلمات المتاحة، راجع صفحة تدريب النموذج.
مثال على القطار
مثال استدلالي
عينة من الصور والتعليقات التوضيحية
تضم مجموعة بيانات الكشف عن التوقيعات مجموعة متنوعة من الصور التي تعرض أنواعًا مختلفة من المستندات والتوقيعات المشروحة. فيما يلي أمثلة لصور من مجموعة البيانات، كل منها مصحوبة بشروحها التوضيحية المقابلة.
- الصور الفسيفسائية: نقدم هنا مجموعة تدريب تتكون من صور مجموعة بيانات موزاييك. الفسيفساء، وهي تقنية تدريب، تدمج صورًا متعددة في صورة واحدة، مما يثري تنوع الدُفعات. تساعد هذه الطريقة على تعزيز قدرة النموذج على التعميم عبر مختلف أحجام التواقيع ونسب الأبعاد والسياقات.
يوضح هذا المثال تنوّع وتعقيد الصور في مجموعة بيانات الكشف عن التواقيع مع التأكيد على فوائد تضمين الفسيفساء أثناء عملية التدريب.
الاستشهادات والشكر والتقدير
تم إصدار مجموعة البيانات المتاحة بموجب ترخيصAGPL-3.0 .
الأسئلة الشائعة
ما هي مجموعة بيانات كشف التواقيع وكيف يمكن استخدامها؟
مجموعة بيانات الكشف عن التوقيعات هي مجموعة من الصور المشروحة التي تهدف إلى الكشف عن التوقيعات البشرية ضمن أنواع مختلفة من الوثائق. يمكن تطبيقها في مهام الرؤية الحاسوبية مثل الكشف عن الأشياء وتتبعها، وذلك في المقام الأول للتحقق من المستندات، والكشف عن الاحتيال، وأبحاث الأرشفة. تساعد مجموعة البيانات هذه في تدريب النماذج على التعرف على التوقيعات في سياقات مختلفة، مما يجعلها ذات قيمة لكل من التطبيقات البحثية والعملية.
كيف يمكنني تدريب نموذج YOLO11n على مجموعة بيانات اكتشاف التوقيع؟
لتدريب نموذج YOLO11n على مجموعة بيانات اكتشاف التوقيع، اتبع الخطوات التالية:
- قم بتنزيل
signature.yaml
ملف تكوين مجموعة البيانات من توقيع.yaml. - استخدم البرنامج النصي التالي Python أو الأمر CLI لبدء التدريب:
مثال على القطار
لمزيد من التفاصيل، راجع صفحة التدريب.
ما هي التطبيقات الرئيسية لمجموعة بيانات كشف التواقيع؟
يمكن استخدام مجموعة بيانات اكتشاف التواقيع من أجل:
- التحقق من المستندات: التحقق تلقائياً من وجود وصحة التوقيعات البشرية في المستندات.
- كشف الاحتيال: تحديد التوقيعات المزورة أو الاحتيالية في المستندات القانونية والمالية.
- البحوث الأرشيفية: مساعدة المؤرخين وأمناء الأرشيف في التحليل الرقمي وفهرسة الوثائق التاريخية.
- التعليم: دعم البحث الأكاديمي والتدريس في مجالات الرؤية الحاسوبية والتعلم الآلي.
كيف يمكنني إجراء الاستدلال باستخدام نموذج مُدرَّب على مجموعة بيانات اكتشاف التواقيع؟
لإجراء الاستدلال باستخدام نموذج مُدرَّب على مجموعة بيانات كشف التوقيع، اتبع الخطوات التالية:
- قم بتحميل نموذجك المضبوط بدقة.
- استخدم البرنامج النصي التالي Python أو الأمر CLI لإجراء الاستدلال:
مثال استدلالي
ما هي بنية مجموعة بيانات كشف التوقيع، وأين يمكنني العثور على مزيد من المعلومات؟
تنقسم مجموعة بيانات اكتشاف التواقيع إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة مع تعليقات توضيحية.
- مجموعة التحقق من الصحة: تتضمن 35 صورة مع تعليقات توضيحية.
للحصول على معلومات مفصلة، يمكنك الرجوع إلى هيكلية مجموعة البيانات القسم. بالإضافة إلى ذلك، يمكنك عرض تكوين مجموعة البيانات الكاملة في قسم signature.yaml
الموجود على توقيع.yaml.