انتقل إلى المحتوى

نظرة عامة على مجموعات البيانات

Ultralytics يوفر الدعم لمجموعات البيانات المختلفة لتسهيل مهام رؤية الكمبيوتر مثل الكشف وتجزئة المثيل وتقدير الوضع والتصنيف وتتبع الكائنات المتعددة. فيما يلي قائمة بأهم Ultralytics مجموعات البيانات ، متبوعة بملخص لكل مهمة من مهام رؤية الكمبيوتر ومجموعات البيانات المعنية.



شاهد: Ultralytics نظرة عامة على مجموعات البيانات

الجديد 🚀 Ultralytics مستكشف

قم بإنشاء تضمينات لمجموعة البيانات الخاصة بك ، وابحث عن صور مماثلة ، وقم بتشغيل استعلامات SQL ، وقم بإجراء بحث دلالي وحتى البحث باستخدام اللغة الطبيعية! يمكنك البدء في استخدام تطبيق واجهة المستخدم الرسومية الخاص بنا أو إنشاء تطبيقك الخاص باستخدام واجهة برمجة التطبيقات. تعرف على المزيد هنا.

Ultralytics لقطة شاشة للمستكشف

مجموعات بيانات الكشف

اكتشاف كائن المربع المحيط هو تقنية رؤية الكمبيوتر التي تتضمن اكتشاف الكائنات وتوطينها في صورة عن طريق رسم مربع محيط حول كل كائن.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع التعليقات التوضيحية الغنية.
  • COCO: مجموعة بيانات واسعة النطاق مصممة لاكتشاف الكائنات وتقسيمها والتعليق عليها مع أكثر من 200 ألف صورة مصنفة.
  • LVIS: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتقسيمها وشرحها مع 1203 فئة كائن.
  • COCO8: يحتوي على أول 4 صور من قطار COCO و COCO val ، ومناسب للاختبارات السريعة.
  • القمح العالمي 2020: مجموعة بيانات من صور رأس القمح التي تم جمعها من جميع أنحاء العالم لمهام اكتشاف الكائنات وتوطينها.
  • Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق لاكتشاف الكائنات مع 365 فئة كائن وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة قطار و 42 ألف صورة تحقق.
  • SKU-110K: مجموعة بيانات تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و 1.7 مليون مربع محيط.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • المركبات العضوية المتطايرة: مجموعة بيانات Pascal Visual Object Classes (VOC) لاكتشاف الكائنات وتجزئتها مع 20 فئة كائن وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لاكتشاف الكائنات في الصور العلوية مع 60 فئة كائن وأكثر من 1 مليون كائن مشروح.
  • Roboflow 100: معيار متنوع للكشف عن الكائنات مع 100 مجموعة بيانات تغطي سبعة مجالات صور لتقييم شامل للنموذج.
  • ورم الدماغ: تتضمن مجموعة البيانات للكشف عن أورام المخ صور التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب مع تفاصيل عن وجود الورم وموقعه وخصائصه. إنه أمر حيوي لتدريب نماذج الرؤية الحاسوبية على أتمتة تحديد الورم ، والمساعدة في التشخيص المبكر وتخطيط العلاج.
  • الحياة البرية الأفريقية: تساعد مجموعة البيانات التي تعرض صورا للحياة البرية الأفريقية ، بما في ذلك الجاموس ووحيد القرن والحمار الوحشي ، في تدريب نماذج الرؤية الحاسوبية. ضروري لتحديد في الموائل المختلفة ، فهو يدعم أبحاث الحياة البرية.

مجموعات بيانات تجزئة المثيل

تجزئة المثيل هي تقنية رؤية الكمبيوتر التي تتضمن تحديد الكائنات وتوطينها في صورة على مستوى البكسل.

  • COCO: مجموعة بيانات واسعة النطاق مصممة لمهام اكتشاف الكائنات وتقسيمها وتسميتها مع أكثر من 200 ألف صورة مصنفة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثال ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للتجزئة.
  • Crack-seg: مجموعة بيانات مصممة خصيصا لاكتشاف الشقوق على الطرق والجدران ، قابلة للتطبيق لكل من مهام اكتشاف الكائنات والتجزئة.
  • Package-seg: مجموعة بيانات مخصصة لتحديد الحزم في المستودعات أو الإعدادات الصناعية ، ومناسبة لكل من تطبيقات اكتشاف الكائنات والتجزئة.
  • Carparts-seg: مجموعة بيانات مصممة خصيصا لتحديد قطع غيار المركبات ، وتلبية احتياجات التصميم والتصنيع والبحث. إنه يخدم كل من مهام اكتشاف الكائنات والتجزئة.

تقدير الوضع

تقدير الوضع هو تقنية تستخدم لتحديد وضع الكائن بالنسبة للكاميرا أو نظام إحداثيات العالم.

  • COCO: مجموعة بيانات واسعة النطاق مع تعليقات توضيحية بشرية مصممة لمهام تقدير الوضع.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضع ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للوضع البشري.
  • وضع النمر: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور ، مشروحة ب 12 نقطة رئيسية لكل نمر لمهام تقدير الوضع.

تصنيف

تصنيف الصور هو مهمة رؤية الكمبيوتر التي تتضمن تصنيف صورة إلى فئة أو فئات محددة مسبقا أو أكثر بناء على محتواها المرئي.

  • Caltech 101: مجموعة بيانات تحتوي على صور ل 101 فئة كائن لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديا.
  • CIFAR-10: مجموعة بيانات من 60K 32x32 صورة ملونة في 10 فئات ، مع 6K صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70000 صورة بتدرج الرمادي ل 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و 20000 فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر تحديا من ImageNet تحتوي على 10 فئات من سلالات لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات من 70000 صورة بتدرج الرمادي للأرقام المكتوبة بخط اليد لمهام تصنيف الصور.

المربعات المحيطة الموجهة (OBB)

المربعات المحيطة الموجهة (OBB) هي طريقة في رؤية الكمبيوتر لاكتشاف الكائنات الزاوية في الصور باستخدام المربعات المحيطة الدوارة ، وغالبا ما يتم تطبيقها على الصور الجوية والأقمار الصناعية.

  • DOTAv2: مجموعة بيانات صور جوية OBB شائعة تحتوي على 1.7 مليون مثيل و 11,268 صورة.

تتبع الكائنات المتعددة

تتبع الكائنات المتعددة هو تقنية رؤية الكمبيوتر التي تنطوي على اكتشاف وتتبع كائنات متعددة بمرور الوقت في تسلسل الفيديو.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية لمهام تتبع الكائنات المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها بشكل جيد مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:

خطوات المساهمة بمجموعة بيانات جديدة

  1. جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة ، مثل قواعد البيانات العامة أو مجموعتك الخاصة.

  2. التعليق على الصور: يمكنك إضافة تعليقات توضيحية إلى هذه الصور باستخدام المربعات المحيطة أو المقاطع أو النقاط الرئيسية، حسب المهمة.

  3. تصدير التعليقات التوضيحيةتحويل هذه التعليقات التوضيحية إلى ملف : YOLO *.txt تنسيق الملف الذي Ultralytics يدعم.

  4. تنظيم مجموعة البياناترتب مجموعة البيانات الخاصة بك في بنية المجلد الصحيحة.: يجب أن يكون لديك train/ و val/ أدلة المستوى الأعلى ، وداخل كل منها ، images/ و labels/ الفرعي.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. إنشاء ملف data.yaml ملففي الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاء ملف data.yaml الذي يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة ، فيمكنك تحسين الصور باستخدام الكود أدناه. هذا غير مطلوب ، ولكن يوصى به لأحجام مجموعات البيانات الأصغر وسرعات التنزيل الأسرع.

  7. مجموعة بيانات مضغوطة: ضغط مجلد مجموعة البيانات بالكامل في ملف مضغوط.

  8. المستند والعلاقات العامة: أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيف تتناسب مع إطار العمل الحالي. بعد ذلك ، أرسل طلب سحب (PR). الرجوع إلى Ultralytics إرشادات المساهمة لمزيد من التفاصيل حول كيفية تقديم العلاقات العامة.

مثال على التعليمات البرمجية لتحسين مجموعة بيانات وضغطها

تحسين مجموعة بيانات وضغطها

from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path('path/to/dataset')

# Optimize images in dataset (optional)
for f in path.rglob('*.jpg'):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

باتباع هذه الخطوات ، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل جيدا مع Ultralyticsالهيكل الحالي.



تم إنشاؤه في 2023-11-12, اخر تحديث 2024-04-02
المؤلفون: برهان كيو (1) ، ضاحك كيو (1) ، رضوان منور (2) ، جلين جوشر (6) ، أبيرامي فينا (1) ، أيوشكسل (2)

التعليقات