نظرة عامة على مجموعات البيانات

توفر Ultralytics الدعم لمختلف مجموعات البيانات لتسهيل مهام الرؤية الحاسوبية مثل الكشف، وتجزئة المثيلات، وتقدير الوضع، والتصنيف، وتتبع الأجسام المتعددة. فيما يلي قائمة بمجموعات بيانات Ultralytics الرئيسية، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.



Watch: Ultralytics Datasets Overview

كشف الأجسام

يُعد كشف الأجسام باستخدام صندوق محيط تقنية رؤية حاسوبية تتضمن اكتشاف الأجسام وتحديد موقعها في الصورة عن طريق رسم صندوق محيط حول كل جسم.

  • African-wildlife: مجموعة بيانات تحتوي على صور للحياة البرية الأفريقية، بما في ذلك الجاموس والفيلة ووحيد القرن والحمر الوحشية.
  • Argoverse: مجموعة بيانات تحتوي على بيانات التتبع ثلاثي الأبعاد وتوقعات الحركة من بيئات حضرية ذات تعليقات توضيحية غنية.
  • Brain-tumor: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور الرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل حول وجود الورم وموقعه وخصائصه.
  • COCO: مجموعة بيانات Common Objects in Context (COCO) هي مجموعة بيانات واسعة النطاق لكشف الأجسام، والتجزئة، وشرح الصور تحتوي على 80 فئة من الأجسام.
  • COCO8: مجموعة فرعية أصغر من أول 4 صور من بيانات التدريب والتحقق في COCO، مناسبة للاختبارات السريعة.
  • COCO8-Grayscale: نسخة بتدرج رمادي من COCO8 تم إنشاؤها عن طريق تحويل RGB إلى تدرج رمادي، وهي مفيدة لتقييم النماذج أحادية القناة.
  • COCO8-Multispectral: نسخة متعددة الأطياف بـ 10 قنوات من COCO8 تم إنشاؤها عن طريق استيفاء أطوال موجات RGB، وهي مفيدة لتقييم النماذج المدركة للطيف.
  • COCO128: مجموعة فرعية أصغر من أول 128 صورة من بيانات التدريب والتحقق في COCO، مناسبة للاختبارات.
  • Construction-PPE: مجموعة بيانات لصور مواقع البناء مشروحة بمعدات السلامة الرئيسية مثل الخوذات والسترات والقفازات والأحذية والنظارات الواقية، إلى جانب ملصقات للمعدات المفقودة، مما يدعم تطوير نماذج AI للامتثال وحماية العمال.
  • Global Wheat 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لمسابقة Global Wheat Challenge 2020.
  • HomeObjects-3K: مجموعة بيانات للمشاهد الداخلية المشروحة التي تضم 12 عنصراً منزلياً شائعاً، مثالية لتطوير واختبار نماذج الرؤية الحاسوبية في أنظمة المنزل الذكي، والروبوتات، والواقع المعزز.
  • KITTI جديد: مجموعة بيانات مشهورة للقيادة الذاتية تتميز بمدخلات ستيريو، وLiDAR، وGPS/IMU، وتُستخدم لكشف الأجسام ثنائية الأبعاد في مشاهد طرق متنوعة.
  • LVIS: مجموعة بيانات واسعة النطاق لكشف الأجسام، والتجزئة، وشرح الصور تحتوي على 1203 فئة من الأجسام.
  • Medical-pills: مجموعة بيانات تحتوي على صور مصنفة للأقراص الطبية، مصممة للمساعدة في مهام مثل مراقبة الجودة الصيدلانية، والفرز، وضمان الامتثال لمعايير الصناعة.
  • Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق لكشف الأجسام تضم 365 فئة من الأجسام وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة تدريب و42 ألف صورة تحقق.
  • RF100: معيار متنوع لكشف الأجسام يضم 100 مجموعة بيانات تغطي سبعة مجالات صور لتقييم شامل للنموذج.
  • Signature: مجموعة بيانات تحتوي على صور لوثائق متنوعة مع توقيعات مشروحة، مما يدعم أبحاث التحقق من الوثائق وكشف الاحتيال.
  • SKU-110K: مجموعة بيانات تتميز بكشف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و1.7 مليون صندوق محيط.
  • VisDrone: مجموعة بيانات تحتوي على بيانات كشف الأجسام وتتبع الأجسام المتعددة من صور ملتقطة بطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • VOC: مجموعة بيانات Pascal Visual Object Classes (VOC) لكشف الأجسام والتجزئة مع 20 فئة من الأجسام وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لكشف الأجسام في الصور الملتقطة من الأعلى تحتوي على 60 فئة من الأجسام وأكثر من مليون جسم مشروح.

تجزئة المثيلات

تجزئة المثيلات هي تقنية رؤية حاسوبية تتضمن تحديد وتعيين موقع الأجسام في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، فإن تجزئة المثيلات تميز بين مثيلات مختلفة لنفس الفئة.

  • Carparts-seg: مجموعة بيانات مصممة خصيصاً لتحديد أجزاء المركبات، وتلبي احتياجات التصميم والتصنيع والبحث. وهي تخدم مهام كشف الأجسام والتجزئة على حد سواء.
  • COCO: مجموعة بيانات واسعة النطاق مصممة لمهام كشف الأجسام والتجزئة وشرح الصور مع أكثر من 200 ألف صورة مصنفة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للتجزئة.
  • COCO128-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 128 صورة COCO مع تعليقات توضيحية للتجزئة.
  • Crack-seg: مجموعة بيانات مصممة خصيصاً للكشف عن الشقوق في الطرق والجدران، وهي قابلة للتطبيق على مهام كشف الأجسام والتجزئة.
  • Package-seg: مجموعة بيانات مصممة لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لكل من تطبيقات كشف الأجسام والتجزئة.

تقدير الوضع

تقدير الوضع هو تقنية تستخدم لتحديد وضع الجسم بالنسبة للكاميرا أو نظام إحداثيات العالم. يتضمن ذلك تحديد النقاط الرئيسية أو المفاصل على الأجسام، وخاصة البشر أو الحيوانات.

  • COCO: مجموعة بيانات واسعة النطاق مع تعليقات توضيحية لوضع الإنسان مصممة لمهام تقدير الوضع.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضع، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية لوضع الإنسان.
  • Dog-pose: مجموعة بيانات شاملة تضم حوالي 6,000 صورة تركز على الكلاب، مشروحة بـ 24 نقطة رئيسية لكل كلب، ومصممة لمهام تقدير الوضع.
  • Hand-Keypoints: مجموعة بيانات موجزة تضم أكثر من 26,000 صورة تركز على أيدي البشر، مشروحة بـ 21 نقطة رئيسية لكل يد، مصممة لمهام تقدير الوضع.
  • Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مشروحة بـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضع.

التصنيف

تصنيف الصور هي مهمة رؤية حاسوبية تتضمن تصنيف الصورة إلى فئة واحدة أو أكثر من الفئات المحددة مسبقاً بناءً على محتواها البصري.

  • Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة من الأجسام لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 تضم 256 فئة من الأجسام وصوراً أكثر صعوبة.
  • CIFAR-10: مجموعة بيانات تضم 60 ألف صورة ملونة بحجم 32x32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 تضم 100 فئة من الأجسام و600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70,000 صورة بتدرج رمادي لـ 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات واسعة النطاق لكشف الأجسام وتصنيف الصور تضم أكثر من 14 مليون صورة و20,000 فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet تضم 10 فئات للتجريب والاختبار بشكل أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يسهل تمييزها للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر صعوبة من ImageNet تحتوي على 10 فئات من سلالات الكلاب لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات تضم 70,000 صورة بتدرج رمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
  • MNIST160: أول 8 صور من كل فئة MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.

صناديق المحيط الموجهة (OBB)

صناديق المحيط الموجهة (OBB) هي طريقة في الرؤية الحاسوبية لاكتشاف الأجسام المائلة في الصور باستخدام صناديق محيط دوارة، وغالباً ما تُطبق على الصور الجوية وصور الأقمار الصناعية. على عكس صناديق المحيط التقليدية، يمكن لـ OBB أن تتناسب بشكل أفضل مع الأجسام ذات التوجهات المختلفة.

  • DOTA-v2: مجموعة بيانات شهيرة لصور OBB الجوية تضم 1.7 مليون مثيل و11,268 صورة.
  • DOTA8: مجموعة فرعية أصغر من أول 8 صور من مجموعة تقسيم DOTAv1، 4 للتدريب و4 للتحقق، مناسبة للاختبارات السريعة.
  • DOTA128: مجموعة فرعية من 128 صورة من مجموعة بيانات DOTA تضم 128 صورة للتدريب والتحقق، مما يوفر توازناً جيداً بين الحجم والتنوع لاختبار نماذج OBB.

تتبع الأجسام المتعددة

تتبع الأجسام المتعددة هو تقنية رؤية حاسوبية تتضمن اكتشاف وتتبع أجسام متعددة بمرور الوقت في تسلسل فيديو. توسع هذه المهمة عملية كشف الأجسام من خلال الحفاظ على هويات متسقة للأجسام عبر الإطارات.

  • Argoverse: مجموعة بيانات تحتوي على بيانات التتبع ثلاثي الأبعاد وتوقعات الحركة من بيئات حضرية مع تعليقات توضيحية غنية لمهام تتبع الأجسام المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات كشف الأجسام وتتبع الأجسام المتعددة من صور ملتقطة بطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها الجيد مع البنية التحتية الحالية. فيما يلي الخطوات الضرورية:



Watch: How to Contribute to Ultralytics Datasets

خطوات المساهمة بمجموعة بيانات جديدة

  1. جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمع هذه الصور من مصادر متنوعة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.

  2. شرح الصور: قم بإضافة تعليقات توضيحية لهذه الصور بصناديق محيط، أو أجزاء، أو نقاط رئيسية، حسب المهمة.

  3. تصدير التعليقات التوضيحية: قم بتحويل هذه التعليقات التوضيحية إلى تنسيق ملف YOLO *.txt الذي تدعمه Ultralytics.

  4. تنظيم مجموعة البيانات: رتب مجموعة بياناتك في هيكل المجلد الصحيح. يجب أن يكون لديك أدلة مستوى علوي images/ و labels/، وداخل كل منهما، دليل فرعي train/ و val/.

    dataset/
    ├── images/
    │   ├── train/
    │   └── val/
    └── labels/
        ├── train/
        └── val/
  5. إنشاء ملف data.yaml: في الدليل الجذري لمجموعة بياناتك، أنشئ ملف data.yaml يصف مجموعة البيانات، والفئات، والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا ليس مطلوباً، ولكنه موصى به لأحجام مجموعات البيانات الأصغر وسرعات تنزيل أسرع.

  7. ضغط مجموعة البيانات: قم بضغط مجلد مجموعة البيانات بأكمله في ملف zip.

  8. التوثيق وتقديم PR: أنشئ صفحة توثيق تصف مجموعة بياناتك وكيفية توافقها مع الإطار الحالي. بعد ذلك، قدم طلباً للسحب (PR). راجع إرشادات المساهمة في Ultralytics لمزيد من التفاصيل حول كيفية تقديم PR.

مثال كود لتحسين وضغط مجموعة بيانات

تحسين وضغط مجموعة بيانات
   from pathlib import Path

   from ultralytics.data.utils import compress_one_image
   from ultralytics.utils.downloads import zip_directory

   # Define dataset directory
   path = Path("path/to/dataset")

   # Optimize images in dataset (optional)
   for f in path.rglob("*.jpg"):
       compress_one_image(f)

   # Zip dataset into 'path/to/dataset.zip'
   zip_directory(path)

باتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع البنية الحالية لـ Ultralytics.

الأسئلة الشائعة

ما هي مجموعات البيانات التي تدعمها Ultralytics لكشف الأجسام؟

تدعم Ultralytics مجموعة واسعة من مجموعات البيانات لـ كشف الأجسام، بما في ذلك:

  • COCO: مجموعة بيانات واسعة النطاق لكشف الأجسام، والتجزئة، وشرح الصور تحتوي على 80 فئة من الأجسام.
  • LVIS: مجموعة بيانات واسعة تحتوي على 1203 فئة من الأجسام، مصممة لكشف الأجسام بدقة أكبر.
  • Argoverse: مجموعة بيانات تحتوي على بيانات التتبع ثلاثي الأبعاد وتوقعات الحركة من بيئات حضرية ذات تعليقات توضيحية غنية.
  • VisDrone: مجموعة بيانات تحتوي على بيانات كشف الأجسام وتتبع الأجسام المتعددة من صور ملتقطة بطائرات بدون طيار.
  • SKU-110K: تتميز بكشف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO قوية لتطبيقات كشف الأجسام المختلفة.

كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

  1. جمع الصور: اجمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
  2. شرح الصور: طبق صناديق محيط، أو أجزاء، أو نقاط رئيسية، حسب المهمة.
  3. تصدير التعليقات التوضيحية: قم بتحويل التعليقات التوضيحية إلى تنسيق YOLO *.txt.
  4. تنظيم مجموعة البيانات: استخدم هيكل المجلد مع أدلة train/ و val/، حيث يحتوي كل منهما على أدلة فرعية images/ و labels/.
  5. إنشاء ملف data.yaml: قم بتضمين أوصاف مجموعة البيانات، والفئات، والمعلومات الأخرى ذات الصلة.
  6. تحسين الصور (اختياري): قلل حجم مجموعة البيانات من أجل الكفاءة.
  7. ضغط مجموعة البيانات: اضغط مجموعة البيانات في ملف zip.
  8. التوثيق وتقديم PR: صف مجموعة بياناتك وقدم طلباً للسحب باتباع إرشادات المساهمة في Ultralytics.

تفضل بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب علي استخدام منصة Ultralytics لمجموعة بياناتي؟

توفر منصة Ultralytics ميزات قوية لإدارة وتحليل مجموعات البيانات، بما في ذلك:

  • إدارة سلسة لمجموعة البيانات: قم برفع وتنظيم وإدارة مجموعات بياناتك في مكان واحد.
  • تكامل فوري مع التدريب: استخدم مجموعات البيانات المرفوعة مباشرة لتدريب النموذج دون إعداد إضافي.
  • أدوات التصور: استكشف وصوّر صور مجموعة بياناتك والتعليقات التوضيحية الخاصة بها.
  • تحليل مجموعة البيانات: احصل على رؤى حول توزيع وخصائص مجموعة بياناتك.

تعمل المنصة على تبسيط الانتقال من إدارة مجموعات البيانات إلى تدريب النماذج، مما يجعل العملية برمتها أكثر كفاءة. تعرف على المزيد حول مجموعات بيانات منصة Ultralytics.

ما هي الميزات الفريدة لنماذج YOLO من Ultralytics لرؤية الحاسوب؟

توفر نماذج YOLO من Ultralytics العديد من الميزات الفريدة لمهام رؤية الحاسوب:

  • أداء في الوقت الفعلي: قدرات استدلال وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
  • تعدد الاستخدامات: دعم مهام الكشف، والتجزئة، والتصنيف، وتقدير الوضع في إطار عمل موحد.
  • نماذج مدربة مسبقاً: إمكانية الوصول إلى نماذج عالية الأداء ومدربة مسبقاً لمختلف التطبيقات، مما يقلل من وقت التدريب.
  • دعم مجتمعي واسع: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها والتطوير.
  • تكامل سهل: واجهة برمجة تطبيقات (API) بسيطة للتكامل مع المشاريع وسير العمل الحالية.

اكتشف المزيد حول نماذج YOLO على صفحة نماذج Ultralytics.

كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics؟

لتحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics، اتبع نموذج التعليمات البرمجية هذا:

تحسين وضغط مجموعة بيانات
from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تساعد هذه العملية في تقليل حجم مجموعة البيانات لتوفير مساحة تخزين أكثر كفاءة وسرعات تنزيل أسرع. تعرف على المزيد حول كيفية تحسين وضغط مجموعة بيانات.

التعليقات