نظرة عامة على مجموعات البيانات

يوفر Ultralytics الدعم لمختلف مجموعات البيانات لتسهيل مهام الرؤية الحاسوبية مثل الكشف، وتجزئة المثيلات، والتجزئة الدلالية، وتقدير الوضعية، والتصنيف، وتتبع الكائنات المتعددة. فيما يلي قائمة بمجموعات بيانات Ultralytics الرئيسية، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.



Watch: Ultralytics Datasets Overview

كشف الكائنات

يُعد كشف الكائنات باستخدام مربع الإحاطة تقنية في الرؤية الحاسوبية تتضمن كشف وتحديد مواقع الكائنات في الصورة عن طريق رسم مربع إحاطة حول كل كائن.

  • African-wildlife: مجموعة بيانات تضم صوراً للحياة البرية الأفريقية، بما في ذلك الجاموس والفيلة ووحيد القرن والحمر الوحشية.
  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع توضيحات غنية.
  • Brain-tumor: مجموعة بيانات للكشف عن أورام المخ تتضمن صور التصوير بالرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل حول وجود الورم وموقعه وخصائصه.
  • COCO: مجموعة البيانات الشائعة في السياق (COCO) هي مجموعة بيانات كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها وتضم 80 فئة من الكائنات.
  • COCO8: مجموعة فرعية أصغر مكونة من أول 4 صور من مجموعتي التدريب والتحقق في COCO، وهي مناسبة للاختبارات السريعة.
  • COCO8-Grayscale: نسخة بتدرج الرمادي من COCO8 تم إنشاؤها عن طريق تحويل صور RGB إلى تدرج رمادي، وهي مفيدة لتقييم النماذج أحادية القناة.
  • COCO8-Multispectral: نسخة متعددة الأطياف بـ 10 قنوات من COCO8 تم إنشاؤها عن طريق استكمال أطوال موجات RGB، وهي مفيدة لتقييم النماذج الواعية بالطيف.
  • COCO128: مجموعة فرعية أصغر مكونة من أول 128 صورة من مجموعتي التدريب والتحقق في COCO، وهي مناسبة للاختبارات.
  • Construction-PPE: مجموعة بيانات لصور مواقع البناء مشروحة بمعدات السلامة الرئيسية مثل الخوذات والسترات والقفازات والأحذية والنظارات الواقية، إلى جانب تسميات للمعدات المفقودة، مما يدعم تطوير نماذج الذكاء الاصطناعي للامتثال وحماية العمال.
  • Global Wheat 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لمسابقة القمح العالمية 2020.
  • HomeObjects-3K: مجموعة بيانات للمشاهد الداخلية المشروحة التي تضم 12 عنصراً منزلياً شائعاً، وهي مثالية لتطوير واختبار نماذج الرؤية الحاسوبية في أنظمة المنزل الذكي والروبوتات والواقع المعزز.
  • KITTI جديدة: مجموعة بيانات معروفة للقيادة الذاتية تتميز بمدخلات ستيريو وLiDAR وGPS/IMU، وتُستخدم لكشف الكائنات ثنائية الأبعاد في مشاهد طريق متنوعة.
  • LVIS: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها وتضم 1203 فئة من الكائنات.
  • Medical-pills: مجموعة بيانات تحتوي على صور مصنفة للأقراص الطبية، صُممت للمساعدة في مهام مثل مراقبة الجودة الصيدلانية، والفرز، وضمان الامتثال لمعايير الصناعة.
  • Objects365: مجموعة بيانات عالية الجودة وكبيرة النطاق لكشف الكائنات تضم 365 فئة من الكائنات وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تضم 1.7 مليون صورة تدريب و42 ألف صورة للتحقق.
  • RF100: معيار متنوع لكشف الكائنات يضم 100 مجموعة بيانات تغطي سبعة مجالات صور لتقييم شامل للنموذج.
  • Signature: مجموعة بيانات تضم صوراً لمستندات متنوعة مع تواقيع مشروحة، مما يدعم أبحاث التحقق من المستندات وكشف الاحتيال.
  • SKU-110K: مجموعة بيانات تتميز بكشف الكائنات الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و1.7 مليون مربع إحاطة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور التقطتها طائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • VOC: مجموعة بيانات فئات الكائنات المرئية Pascal (VOC) لكشف الكائنات وتجزئتها مع 20 فئة من الكائنات وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لكشف الكائنات في الصور العلوية مع 60 فئة من الكائنات وأكثر من مليون كائن مشروح.

تجزئة المثيلات

تجزئة المثيلات هي تقنية رؤية حاسوبية تتضمن تحديد وتحديد مواقع الكائنات في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، تقوم تجزئة المثيلات بالتمييز بين مثيلات مختلفة من نفس الفئة.

  • Carparts-seg: مجموعة بيانات مصممة خصيصاً لتحديد أجزاء المركبات، وتلبي احتياجات التصميم والتصنيع والبحث. وهي تخدم مهام كشف الكائنات وتجزئتها معاً.
  • COCO: مجموعة بيانات كبيرة النطاق مصممة لمهام كشف الكائنات وتجزئتها والتعليق عليها مع أكثر من 200 ألف صورة مصنفة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 8 صور من COCO مع شروحات التجزئة.
  • COCO128-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 128 صورة من COCO مع شروحات التجزئة.
  • Crack-seg: مجموعة بيانات مصممة خصيصاً لكشف التشققات على الطرق والجدران، وهي قابلة للتطبيق لمهام كشف الكائنات وتجزئتها.
  • Package-seg: مجموعة بيانات مخصصة لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لتطبيقات كشف الكائنات وتجزئتها.

التجزئة الدلالية

تقوم التجزئة الدلالية بتعيين تسمية فئة لكل بكسل في الصورة، مما ينتج خرائط مشهد كثيفة لتطبيقات مثل القيادة الذاتية، وتحليل المشهد، ورسم خرائط الغطاء الأرضي.

  • Cityscapes: مجموعة بيانات التجزئة الدلالية لمشاهد الشوارع الحضرية مع 19 فئة تدريب.
  • Cityscapes8: مجموعة فرعية مدمجة من Cityscapes مكونة من 8 صور لإجراء فحوصات سريعة لخط أنابيب التجزئة الدلالية.
  • ADE20K: مجموعة بيانات تحليل المشهد مع 150 فئة دلالية.

تقدير الوضعية

تقدير الوضعية هو تقنية تُستخدم لتحديد وضعية الكائن بالنسبة للكاميرا أو نظام إحداثيات العالم. يتضمن ذلك تحديد النقاط الرئيسية أو المفاصل على الكائنات، وخاصة البشر أو الحيوانات.

  • COCO: مجموعة بيانات كبيرة النطاق مع شروحات لوضعية الإنسان مصممة لمهام تقدير الوضعية.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضعية، تحتوي على مجموعة فرعية من 8 صور من COCO مع شروحات لوضعية الإنسان.
  • Dog-pose: مجموعة بيانات شاملة تضم حوالي 6000 صورة تركز على الكلاب، ومشروحة بـ 24 نقطة رئيسية لكل كلب، ومصممة لمهام تقدير الوضعية.
  • Hand-Keypoints: مجموعة بيانات موجزة تضم أكثر من 26 ألف صورة تركز على أيدي البشر، ومشروحة بـ 21 نقطة رئيسية لكل يد، ومصممة لمهام تقدير الوضعية.
  • Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، ومشروحة بـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.

التصنيف

تصنيف الصور هو مهمة رؤية حاسوبية تتضمن تصنيف الصورة إلى فئة واحدة أو أكثر من الفئات المحددة مسبقاً بناءً على محتواها المرئي.

  • Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة من الكائنات لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة من الكائنات وصور أكثر تحدياً.
  • CIFAR-10: مجموعة بيانات من 60 ألف صورة ملونة بحجم 32x32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة من الكائنات و600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70 ألف صورة بتدرج الرمادي لـ 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و20 ألف فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet مع 10 فئات لتجربة واختبار أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يسهل تمييزها للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر تحدياً من ImageNet تحتوي على 10 فئات من سلالات الكلاب لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات من 70 ألف صورة بتدرج الرمادي للأرقام المكتوبة بخط اليد لمهام تصنيف الصور.
  • MNIST160: أول 8 صور من كل فئة MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.

مربعات الإحاطة الموجهة (OBB)

مربعات الإحاطة الموجهة (OBB) هي طريقة في الرؤية الحاسوبية لكشف الكائنات المائلة في الصور باستخدام مربعات إحاطة مدورة، وغالباً ما تُطبق على الصور الجوية وصور الأقمار الصناعية. على عكس مربعات الإحاطة التقليدية، يمكن لـ OBB ملاءمة الكائنات بشكل أفضل في اتجاهات مختلفة.

  • DOTA-v2: مجموعة بيانات شائعة للصور الجوية OBB مع 1.7 مليون مثيل و11,268 صورة.
  • DOTA8: مجموعة فرعية أصغر من أول 8 صور من مجموعة تقسيم DOTAv1، 4 للتدريب و4 للتحقق، وهي مناسبة للاختبارات السريعة.
  • DOTA128: مجموعة فرعية مكونة من 128 صورة من مجموعة بيانات DOTA مع 128 صورة للتدريب والتحقق، مما يوفر توازناً جيداً بين الحجم والتنوع لاختبار نماذج OBB.

تتبع الكائنات المتعددة

تتبع الكائنات المتعددة هو تقنية رؤية حاسوبية تتضمن كشف وتتبع كائنات متعددة بمرور الوقت في تسلسل فيديو. توسع هذه المهمة كشف الكائنات من خلال الحفاظ على هويات متسقة للكائنات عبر الإطارات.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع شروحات غنية لمهام تتبع الكائنات المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور التقطتها طائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها الجيد مع البنية التحتية الحالية. فيما يلي الخطوات الضرورية:



Watch: How to Contribute to Ultralytics Datasets

خطوات المساهمة بمجموعة بيانات جديدة

  1. جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.

  2. شرح الصور: قم بشرح هذه الصور بمربعات إحاطة، أو أجزاء، أو نقاط رئيسية، حسب المهمة.

  3. تصدير الشروحات: حوّل هذه الشروحات إلى تنسيق ملف YOLO *.txt الذي يدعمه Ultralytics.

  4. تنظيم مجموعة البيانات: رتب مجموعة بياناتك في هيكل المجلد الصحيح. يجب أن يكون لديك أدلة مستوى علوي images/ و labels/، وداخل كل منهما، دليل فرعي train/ و val/.

    dataset/
    ├── images/
    │   ├── train/
    │   └── val/
    └── labels/
        ├── train/
        └── val/
  5. إنشاء ملف data.yaml: في الدليل الجذري لمجموعة البيانات الخاصة بك، أنشئ ملف data.yaml يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا ليس مطلوباً، ولكنه موصى به لأحجام مجموعات البيانات الأصغر وسرعات تنزيل أسرع.

  7. ضغط مجموعة البيانات: اضغط مجلد مجموعة البيانات بالكامل في ملف zip.

  8. التوثيق وتقديم طلب سحب (PR): أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيفية ملاءمتها للإطار الحالي. بعد ذلك، قم بتقديم طلب سحب (PR). راجع إرشادات المساهمة في Ultralytics لمزيد من التفاصيل حول كيفية تقديم طلب سحب.

كود مثالي لتحسين وضغط مجموعة بيانات

تحسين وضغط مجموعة بيانات
   from pathlib import Path

   from ultralytics.data.utils import compress_one_image
   from ultralytics.utils.downloads import zip_directory

   # Define dataset directory
   path = Path("path/to/dataset")

   # Optimize images in dataset (optional)
   for f in path.rglob("*.jpg"):
       compress_one_image(f)

   # Zip dataset into 'path/to/dataset.zip'
   zip_directory(path)

باتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع البنية الحالية لـ Ultralytics.

الأسئلة الشائعة

ما هي مجموعات البيانات التي يدعمها Ultralytics لكشف الكائنات؟

يدعم Ultralytics مجموعة واسعة من مجموعات البيانات لـ كشف الكائنات، بما في ذلك:

  • COCO: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها وتضم 80 فئة من الكائنات.
  • LVIS: مجموعة بيانات واسعة النطاق مع 1203 فئة من الكائنات، صُممت لكشف وتجزئة الكائنات بشكل أكثر دقة.
  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع توضيحات غنية.
  • VisDrone: مجموعة بيانات مع بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور التقطتها طائرات بدون طيار.
  • SKU-110K: تتميز بكشف الكائنات الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO قوية لمختلف تطبيقات كشف الكائنات.

كيف يمكنني المساهمة بمجموعة بيانات جديدة إلى Ultralytics؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

  1. جمع الصور: اجمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
  2. شرح الصور: طبق مربعات إحاطة، أو أجزاء، أو نقاط رئيسية، حسب المهمة.
  3. تصدير الشروحات: حوّل الشروحات إلى تنسيق YOLO *.txt.
  4. تنظيم مجموعة البيانات: استخدم هيكل المجلد مع أدلة train/ و val/، حيث يحتوي كل منهما على أدلة فرعية images/ و labels/.
  5. إنشاء ملف data.yaml: قم بتضمين أوصاف مجموعة البيانات، والفئات، والمعلومات الأخرى ذات الصلة.
  6. تحسين الصور (اختياري): قلل حجم مجموعة البيانات من أجل الكفاءة.
  7. ضغط مجموعة البيانات: اضغط مجموعة البيانات في ملف zip.
  8. التوثيق وتقديم طلب سحب (PR): صف مجموعة البيانات الخاصة بك وقدم طلب سحب باتباع إرشادات المساهمة في Ultralytics.

قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب أن أستخدم منصة Ultralytics لمجموعة البيانات الخاصة بي؟

توفر Ultralytics Platform ميزات قوية لإدارة وتحليل مجموعات البيانات، بما في ذلك:

  • إدارة سلسة لمجموعات البيانات: قم برفع وتنظيم وإدارة مجموعات بياناتك في مكان واحد.
  • تكامل فوري مع التدريب: استخدم مجموعات البيانات المرفوعة مباشرة لتدريب النماذج دون الحاجة إلى إعدادات إضافية.
  • أدوات التصور: استكشف وصور صور مجموعات البيانات والتعليقات التوضيحية الخاصة بك.
  • تحليل مجموعات البيانات: احصل على رؤى حول توزيع وخصائص مجموعات البيانات الخاصة بك.

تعمل المنصة على تبسيط الانتقال من إدارة مجموعات البيانات إلى تدريب النماذج، مما يجعل العملية بأكملها أكثر كفاءة. اعرف المزيد حول Ultralytics Platform Datasets.

ما هي الميزات الفريدة لنماذج YOLO من Ultralytics لرؤية الحاسوب؟

توفر نماذج YOLO من Ultralytics العديد من الميزات الفريدة لمهام رؤية الحاسوب:

  • الأداء في الوقت الحقيقي: قدرات استنتاج وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
  • تعدد الاستخدامات: دعم مهام الكشف، وتجزئة المثيل، والتجزئة الدلالية، والتصنيف، وتقدير الوضع في إطار عمل موحد.
  • نماذج مدربة مسبقاً: الوصول إلى نماذج عالية الأداء ومدربة مسبقاً لمختلف التطبيقات، مما يقلل من وقت التدريب.
  • دعم مجتمعي واسع: مجتمع نشط وتوثيق شامل لاستكشاف الأخطاء وإصلاحها والتطوير.
  • تكامل سهل: واجهة برمجة تطبيقات (API) بسيطة للتكامل مع المشاريع وسير العمل الحالية.

اكتشف المزيد حول نماذج YOLO في صفحة Ultralytics Models.

كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics؟

لتحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics، اتبع كود المثال التالي:

تحسين وضغط مجموعة بيانات
from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تساعد هذه العملية في تقليل حجم مجموعة البيانات لتحقيق تخزين أكثر كفاءة وسرعات تنزيل أسرع. اعرف المزيد حول كيفية تحسين وضغط مجموعة البيانات.

تعليقات