نظرة عامة على مجموعات البيانات

Q: What datasets does Ultralytics support for object detection?

تدعم Ultralytics مجموعة واسعة من مجموعات البيانات لاكتشاف الكائنات، بما في ذلك: تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO قوية لتطبيقات اكتشاف الكائنات المختلفة.

Q: How do I contribute a new dataset to Ultralytics?

يتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات: قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

Q: Why should I use Ultralytics Platform for my dataset?

توفر منصة Ultralytics ميزات قوية لإدارة وتحليل مجموعات البيانات، بما في ذلك: تعمل المنصة على تبسيط الانتقال من إدارة مجموعات البيانات إلى تدريب النماذج، مما يجعل العملية بأكملها أكثر كفاءة. تعرف على المزيد حول مجموعات بيانات منصة Ultralytics.

Q: How can I optimize and zip a dataset using Ultralytics tools?

لتحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics، اتبع نموذج التعليمات البرمجية هذا: تساعد هذه العملية على تقليل حجم مجموعة البيانات لتخزين أكثر كفاءة وسرعات تنزيل أسرع. تعرف على المزيد حول كيفية تحسين وضغط مجموعة البيانات.

توفر Ultralytics دعمًا لمجموعات بيانات متنوعة لتسهيل مهام الرؤية الحاسوبية مثل الكشف عن الأجسام، و تقسيم المثيلات، وتقدير الوضعية، والتصنيف، وتتبع الأجسام المتعددة. فيما يلي قائمة بمجموعات بيانات Ultralytics الرئيسية، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.

شاهد: نظرة عامة على مجموعات بيانات Ultralytics

الكشف عن الكائنات

الكشف عن الأجسام باستخدام المربعات المحيطة هو أسلوب رؤية حاسوبية يتضمن اكتشاف وتحديد مواقع الأجسام في صورة عن طريق رسم مربع محيط حول كل جسم.

African-wildlife: مجموعة بيانات تعرض صورًا للحياة البرية الأفريقية، بما في ذلك الجاموس والفيلة ووحيد القرن والحمار الوحشي.
Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثي الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية.
Brain-tumor: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور الرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل حول وجود الورم وموقعه وخصائصه.
COCO: الكائنات الشائعة في السياق (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتقسيمها والتعليق عليها مع 80 فئة من فئات الأجسام.
COCO8: مجموعة فرعية أصغر من أول 4 صور من COCO train و COCO val، وهي مناسبة للاختبارات السريعة.
COCO8-Grayscale: نسخة ذات تدرج رمادي من COCO8 تم إنشاؤها عن طريق تحويل RGB إلى تدرج رمادي، وهي مفيدة لتقييم النماذج أحادية القناة.
COCO8-Multispectral: نسخة متعددة الأطياف ذات 10 قنوات من COCO8 تم إنشاؤها عن طريق استيفاء أطوال موجات RGB، وهي مفيدة لتقييم النماذج المدركة للأطياف.
COCO128: مجموعة فرعية أصغر من أول 128 صورة من COCO train و COCO val، وهي مناسبة للاختبارات.
Construction-PPE: مجموعة بيانات لصور مواقع البناء مُعلّمة بمعدات السلامة الرئيسية مثل الخوذات والسترات والقفازات والأحذية والنظارات الواقية، بالإضافة إلى ملصقات للمعدات المفقودة، لدعم تطوير نماذج الذكاء الاصطناعي للامتثال وحماية العمال.
Global Wheat 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لتحدي القمح العالمي 2020.
HomeObjects-3K: مجموعة بيانات لمشاهد داخلية مُعلّمة تعرض 12 عنصرًا منزليًا شائعًا، وهي مثالية لتطوير واختبار نماذج رؤية الكمبيوتر في أنظمة المنزل الذكي والروبوتات والواقع المعزز.
KITTI الجديد: مجموعة بيانات معروفة للقيادة الذاتية تتميز بمدخلات استريو، LiDAR، و GPS/IMU، وتُستخدم لـ detect الكائنات ثنائية الأبعاد في مشاهد الطرق المتنوعة.
LVIS: مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتقسيمها وتسميتها مع 1203 فئة من الأجسام.
Medical-pills: مجموعة بيانات تحتوي على صور مُصنفة لحبوب طبية، وهي مُصممة للمساعدة في مهام مثل مراقبة الجودة الدوائية والفرز وضمان الامتثال لمعايير الصناعة.
Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق للكشف عن الأجسام مع 365 فئة من الأجسام وأكثر من 600 ألف صورة مشروحة.
OpenImagesV7: مجموعة بيانات شاملة من Google مع 1.7 مليون صورة تدريب و 42 ألف صورة تحقق.
RF100: معيار مرجعي متنوع لاكتشاف الكائنات يتضمن 100 مجموعة بيانات تغطي سبعة مجالات تصوير لتقييم شامل للنماذج.
Signature: مجموعة بيانات تعرض صورًا لمستندات مختلفة مع توقيعات مُعلَّمة، لدعم التحقق من المستندات وأبحاث الكشف عن الاحتيال.
SKU-110K: مجموعة بيانات تتميز بالكشف الكثيف عن الأجسام في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و 1.7 مليون مربع محيط.
VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وتتبع الأجسام المتعددة من الصور التي تم التقاطها بواسطة الطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
VOC: مجموعة بيانات Pascal Visual Object Classes ‏(VOC) لكشف الأجسام وتجزئتها مع 20 فئة من الأجسام وأكثر من 11 ألف صورة.
xView: مجموعة بيانات لاكتشاف الكائنات في الصور العلوية، تحتوي على 60 فئة كائن وأكثر من مليون كائن مُعلَّم.

تجزئة المثيل

تجزئة المثيل هي تقنية رؤية حاسوبية تتضمن تحديد وتوطين الكائنات في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، فإن تجزئة المثيل تميز بين الحالات المختلفة من نفس الفئة.

Carparts-seg: مجموعة بيانات مُصممة خصيصًا لتحديد أجزاء المركبات، وتلبي احتياجات التصميم والتصنيع والبحث. وهي تخدم مهام اكتشاف الكائنات وتجزئتها.
COCO: مجموعة بيانات واسعة النطاق مصممة لمهام الكشف عن الأجسام وتقسيمها والتعليق عليها مع أكثر من 200 ألف صورة مُصنَّفة.
COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 8 صور COCO مع شروحات تجزئة.
COCO128-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات (instance segmentation)، تحتوي على مجموعة فرعية من 128 صورة COCO مع شروحات تجزئة.
Crack-seg: مجموعة بيانات مُصممة خصيصًا لاكتشاف الشقوق على الطرق والجدران، وهي قابلة للتطبيق في مهام اكتشاف الكائنات وتجزئتها.
Package-seg: مجموعة بيانات مُخصصة لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لتطبيقات اكتشاف الكائنات وتجزئتها.

تقدير الوضع

تقدير الوضعية هو أسلوب يستخدم لتحديد وضعية الكائن بالنسبة للكاميرا أو نظام الإحداثيات العالمي. يتضمن ذلك تحديد النقاط أو المفاصل الرئيسية على الكائنات، وخاصة البشر أو الحيوانات.

COCO: مجموعة بيانات واسعة النطاق مع شروحات لوضعية الإنسان مصممة لمهام تقدير الوضعية.
COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضعية، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية لوضعية الإنسان.
Dog-pose: مجموعة بيانات شاملة تضم ما يقرب من 6000 صورة تركز على الكلاب، مع تعليقات توضيحية لـ 24 نقطة رئيسية لكل كلب، وهي مصممة خصيصًا لمهام تقدير الوضعية.
Hand-Keypoints: مجموعة بيانات موجزة تضم أكثر من 26000 صورة تركز على الأيدي البشرية، مع تعليقات توضيحية لـ 21 نقطة رئيسية لكل يد، وهي مصممة لمهام تقدير الوضعية.
Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مع تعليقات توضيحية لـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.

التصنيف

Image classification هي مهمة رؤية حاسوبية تتضمن تصنيف صورة إلى فئة أو أكثر من الفئات المحددة مسبقًا بناءً على محتواها المرئي.

Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة كائن لمهام تصنيف الصور.
Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديًا.
CIFAR-10: مجموعة بيانات تتكون من 60 ألف صورة ملونة بحجم 32 × 32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
Fashion-MNIST: مجموعة بيانات تتكون من 70,000 صورة ذات تدرج رمادي لـ 10 فئات أزياء لمهام classify الصور.
ImageNet: مجموعة بيانات واسعة النطاق لـ object detection وتصنيف الصور مع أكثر من 14 مليون صورة و 20000 فئة.
ImageNet-10: مجموعة فرعية أصغر من ImageNet مع 10 فئات لتجربة واختبار أسرع.
Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات سهلة التمييز لتدريب واختبار أسرع.
Imagewoof: مجموعة فرعية أكثر تحديًا من ImageNet تحتوي على 10 فئات لسلالات الكلاب لمهام classify الصور.
MNIST: مجموعة بيانات تتكون من 70,000 صورة ذات تدرج رمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
MNIST160: أول 8 صور من كل فئة MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.

مربعات الإحاطة الموجهة (OBB)

الصناديق المحيطة الموجهة (OBB) هي طريقة في رؤية الكمبيوتر لاكتشاف الكائنات الزاوية في الصور باستخدام صناديق محيطة مدورة، وغالبًا ما يتم تطبيقها على الصور الجوية وصور الأقمار الصناعية. على عكس الصناديق المحيطة التقليدية، يمكن لـ OBB أن تناسب بشكل أفضل الكائنات في اتجاهات مختلفة.

DOTA-v2: هي مجموعة بيانات شائعة للصور الجوية OBB تحتوي على 1.7 مليون حالة و 11,268 صورة.
DOTA8: هي مجموعة فرعية أصغر من أول 8 صور من مجموعة DOTAv1 المقسمة، 4 للتدريب و 4 للتحقق من الصحة، وهي مناسبة للاختبارات السريعة.
DOTA128: مجموعة فرعية من 128 صورة من مجموعة بيانات DOTA تحتوي على 128 صورة للتدريب والتحقق، مما يوفر توازنًا جيدًا بين الحجم والتنوع لاختبار نماذج obb.

تتبع الأجسام المتعددة

تتبع الأجسام المتعددة هو تقنية رؤية حاسوبية تتضمن اكتشاف وتتبع أجسام متعددة بمرور الوقت في تسلسل فيديو. توسع هذه المهمة اكتشاف الأجسام عن طريق الحفاظ على هويات متسقة للأجسام عبر الإطارات.

Argoverse: هي مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تع annotations غنية لمهام تتبع الأجسام المتعددة.
VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وتتبع الأجسام المتعددة من الصور التي تم التقاطها بواسطة الطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

يتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها جيدًا مع البنية التحتية الحالية. فيما يلي الخطوات الضرورية:

شاهد: كيفية المساهمة في مجموعات بيانات Ultralytics.

خطوات المساهمة بمجموعة بيانات جديدة

تجميع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمع هذه الصور من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
توصيف الصور: قم بتوصيف هذه الصور باستخدام مربعات محيطة أو مقاطع أو نقاط رئيسية، اعتمادًا على المهمة.
تصدير التوصيفات: قم بتحويل هذه التوصيفات إلى YOLO *.txt تنسيق الملف الذي تدعمه Ultralytics.
تنظيم مجموعة البيانات: رتب مجموعة البيانات الخاصة بك في هيكل المجلد الصحيح. يجب أن يكون لديك images/ و labels/ الدلائل ذات المستوى الأعلى، وداخل كل منها، train/ و val/ دليل فرعي.
```
dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/
```
إنشاء data.yaml ملف: في الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاء data.yaml ملف يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.
تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا ليس مطلوبًا، ولكنه مُوصى به لأحجام مجموعات البيانات الأصغر وسرعات التنزيل الأسرع.
ضغط مجموعة البيانات: قم بضغط مجلد مجموعة البيانات بأكمله في ملف مضغوط.
توثيق وطلب سحب (PR): أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيف تتناسب مع الإطار الحالي. بعد ذلك، أرسل طلب سحب (PR). ارجع إلى إرشادات المساهمة في Ultralytics لمزيد من التفاصيل حول كيفية إرسال طلب سحب.

مثال على التعليمات البرمجية لتحسين مجموعة البيانات وضغطها

تحسين وضغط مجموعة البيانات

Python

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

باتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع هيكل Ultralytics الحالي.

الأسئلة الشائعة

ما هي مجموعات البيانات التي تدعمها Ultralytics للكشف عن الأجسام؟

تدعم Ultralytics مجموعة واسعة من مجموعات البيانات لـ اكتشاف الكائنات، بما في ذلك:

COCO: مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتقسيمها والتعليق عليها مع 80 فئة من فئات الأجسام.
LVIS: مجموعة بيانات واسعة النطاق مع 1203 فئة كائن، مصممة لاكتشاف الكائنات وتجزئتها بشكل أكثر دقة.
Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثي الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية.
VisDrone: مجموعة بيانات مع بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور الملتقطة بواسطة الطائرات بدون طيار.
SKU-110K: تتميز باكتشاف الكائنات الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO قوية لمختلف تطبيقات الكشف عن الأجسام.

كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

جمع الصور: جمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
تسمية الصور: تطبيق مربعات إحاطة أو أجزاء أو نقاط رئيسية، اعتمادًا على المهمة.
تصدير التوصيفات: تحويل التسميات التوضيحية إلى YOLO *.txt صيغة.
تنظيم مجموعة البيانات: استخدم هيكل المجلد مع train/ و val/ الدلائل، يحتوي كل منها على images/ و labels/ الدلائل الفرعية.
إنشاء data.yaml ملف: قم بتضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة.
تحسين الصور (اختياري): تقليل حجم مجموعة البيانات لتحقيق الكفاءة.
ضغط مجموعة البيانات: ضغط مجموعة البيانات في ملف مضغوط.
توثيق وطلب سحب (PR): صف مجموعة البيانات الخاصة بك وأرسل طلب سحب باتباع إرشادات المساهمة في Ultralytics.

تفضل بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب أن أستخدم منصة Ultralytics لمجموعة بياناتي؟

منصة Ultralytics تقدم ميزات قوية لإدارة وتحليل مجموعات البيانات، بما في ذلك:

إدارة سلسة لمجموعات البيانات: قم بتحميل وتنظيم وإدارة مجموعات البيانات الخاصة بك في مكان واحد.
التكامل الفوري للتدريب: استخدم مجموعات البيانات التي تم تحميلها مباشرة لتدريب النموذج دون إعداد إضافي.
أدوات التصور: استكشف وتصور صور مجموعة البيانات والتعليقات التوضيحية الخاصة بك.
تحليل مجموعة البيانات: احصل على رؤى حول توزيع وخصائص مجموعة البيانات الخاصة بك.

تعمل المنصة على تبسيط الانتقال من إدارة مجموعات البيانات إلى تدريب النماذج، مما يجعل العملية بأكملها أكثر كفاءة. تعرف على المزيد حول مجموعات بيانات منصة Ultralytics.

ما هي الميزات الفريدة لنماذج Ultralytics YOLO للرؤية الحاسوبية؟

توفر نماذج Ultralytics YOLO العديد من الميزات الفريدة لمهام الرؤية الحاسوبية:

أداء في الوقت الفعلي: قدرات استدلال وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
تنوع الاستخدام: دعم مهام الكشف والتجزئة والتصنيف وتقدير الوضعية في إطار عمل موحد.
نماذج مُدرَّبة مسبقًا: الوصول إلى نماذج مُدرَّبة مسبقًا عالية الأداء لمختلف التطبيقات، مما يقلل وقت التدريب.
دعم مجتمعي واسع: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها والتطوير.
سهولة التكامل: واجهة برمجة تطبيقات (API) بسيطة للتكامل مع المشاريع وسير العمل الحالية.

اكتشف المزيد حول نماذج YOLO في صفحة نماذج Ultralytics.

كيف يمكنني تحسين مجموعة البيانات وضغطها باستخدام أدوات Ultralytics؟

لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics، اتبع مثال التعليمات البرمجية التالي: