نظرة عامة على مجموعات البيانات
Ultralytics يوفر دعمًا لمجموعات بيانات متنوعة لتسهيل مهام الرؤية الحاسوبية مثل الكشف، وتجزئة المثيلات، وتقدير الوضع، والتصنيف، والتتبع متعدد الأجسام. فيما يلي قائمة بمجموعات البيانات الرئيسية Ultralytics ، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.
شاهد: Ultralytics نظرة عامة على مجموعات البيانات
اكتشاف الكائن
اكتشاف الأجسام في الصندوق المحدود هي تقنية رؤية حاسوبية تتضمن اكتشاف الأجسام في الصورة وتحديد موقعها من خلال رسم مربع محدد حول كل جسم.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية.
- COCO: الكائنات الشائعة في السياق (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من الكائنات.
- LVIS: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 1203 فئة من الكائنات.
- COCO8: مجموعة فرعية أصغر من أول 4 صور من تدريب COCO وCOCO val، مناسبة للاختبارات السريعة.
- COCO128: مجموعة فرعية أصغر من أول 128 صورة من أول 128 صورة من تدريب COCO وCOCO val، مناسبة للاختبارات.
- القمح العالمي 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح للتحدي العالمي للقمح 2020.
- Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق للكشف عن الكائنات مع 365 فئة من الكائنات وأكثر من 600 ألف صورة مشروحة.
- OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة تدريب و42 ألف صورة تحقق من صحتها.
- SKU-110K: مجموعة بيانات تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و1.7 مليون مربع محدد.
- VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
- VOC: مجموعة بيانات Pascal Visual Object Classes (VOC) للكشف عن الكائنات وتجزئتها مع 20 فئة من الكائنات وأكثر من 11 ألف صورة.
- xView: مجموعة بيانات للكشف عن الكائنات في الصور العلوية مع 60 فئة من الكائنات وأكثر من مليون كائن مشروح.
- RF100: معيار متنوع للكشف عن الأجسام يحتوي على 100 مجموعة بيانات تغطي سبعة مجالات تصوير لتقييم النموذج الشامل.
- أورام الدماغ: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور التصوير بالرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل عن وجود الورم وموقعه وخصائصه.
- الحياة البرية الأفريقية: مجموعة بيانات تضم صوراً للحياة البرية الأفريقية، بما في ذلك الجاموس، والفيل، ووحيد القرن، والحمير الوحشية.
- التوقيع: مجموعة بيانات تضم صوراً لوثائق مختلفة مع توقيعات مشروحة، لدعم أبحاث التحقق من المستندات والكشف عن الاحتيال.
- حبوب طبية: مجموعة بيانات تحتوي على صور مصنفة للحبوب الطبية، مصممة للمساعدة في مهام مثل مراقبة جودة المستحضرات الصيدلانية والفرز وضمان الامتثال لمعايير الصناعة.
تجزئة المثيل
تجزئة المثيل هي تقنية رؤية حاسوبية تتضمن تحديد وتوطين الكائنات في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، فإن تجزئة المثيل تميز بين المثيلات المختلفة من نفس الفئة.
- COCO: مجموعة بيانات واسعة النطاق مصممة لاكتشاف الأجسام وتجزئتها ومهام التسمية التوضيحية مع أكثر من 200 ألف صورة موسومة.
- COCO8-seg: مجموعة بيانات أصغر لمهام التجزئة على سبيل المثال، تحتوي على مجموعة فرعية من 8 صور COCO مع شروح التجزئة.
- COCO128-seg: مجموعة بيانات أصغر لمهام التجزئة على سبيل المثال، تحتوي على مجموعة فرعية من 128 صورة COCO مع شروح التجزئة.
- Crack-seg: مجموعة بيانات مصممة خصيصًا للكشف عن الشقوق على الطرق والجدران، وهي قابلة للتطبيق في كل من مهام الكشف عن الأجسام وتجزئتها.
- Package-seg: مجموعة بيانات مصممة خصيصًا لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لكل من تطبيقات اكتشاف الأجسام وتجزئتها.
- Carparts-seg: مجموعة بيانات مصممة خصيصًا لتحديد أجزاء المركبات، تلبي احتياجات التصميم والتصنيع والبحث. وهي تُستخدم في كل من مهام الكشف عن الكائنات وتجزئتها.
تقدير الوضعية
تقدير الوضعية هي تقنية تُستخدم لتحديد وضعية الجسم بالنسبة للكاميرا أو نظام الإحداثيات العالمي. ويتضمن ذلك تحديد النقاط أو المفاصل الرئيسية على الأجسام، خاصةً البشر أو الحيوانات.
- COCO: مجموعة بيانات واسعة النطاق مع شروح الوضعية البشرية مصممة لمهام تقدير الوضعية.
- COCO8-pose: مجموعة بيانات أصغر حجماً لمهام تقدير الوضعية تحتوي على مجموعة فرعية من 8 صور COCO مع شروح الوضعية البشرية.
- Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مشروحة بـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.
- نقاط مفاتيح اليد: مجموعة بيانات موجزة تحتوي على أكثر من 26,000 صورة تتمحور حول الأيدي البشرية، مشروحة بـ 21 نقطة رئيسية لكل يد، مصممة لمهام تقدير الوضعية.
- وضعية الكلب: مجموعة بيانات شاملة تضم ما يقرب من 6000 صورة تركز على الكلاب، مشروحة بـ 24 نقطة رئيسية لكل كلب، مصممة خصيصًا لمهام تقدير الوضعية.
التصنيف
تصنيف الصور هو مهمة رؤية حاسوبية تتضمن تصنيف الصورة إلى فئة أو فئات محددة مسبقًا أو أكثر بناءً على محتواها المرئي.
- Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة من فئات الكائنات لمهام تصنيف الصور.
- كالتك 256: نسخة موسعة من Caltech 101 تحتوي على 256 فئة من الكائنات وصور أكثر تحدياً.
- CIFAR-10: مجموعة بيانات مكونة من 60 ألف صورة ملونة مقاس 32 × 32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
- CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة من فئات الكائنات و600 صورة لكل فئة.
- Fashion-MNIST: مجموعة بيانات تتألف من 70,000 صورة بتدرج الرمادي لـ 10 فئات من الأزياء لمهام تصنيف الصور.
- ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الأجسام وتصنيف الصور مع أكثر من 14 مليون صورة و20,000 فئة.
- ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
- Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة من أجل تدريب واختبار أسرع.
- Imagewoof: مجموعة فرعية أكثر صعوبة من ImageNet تحتوي على 10 فئات من سلالات الكلاب لمهام تصنيف الصور.
- MNIST: مجموعة بيانات تضم 70,000 صورة بتدرج الرمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
- MNIST160: أول 8 صور من كل فئة MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.
المربعات المحدودة الموجهة (OBB)
الصناديق المحدودة الموجهة (OBB) هي طريقة في الرؤية الحاسوبية للكشف عن الأجسام ذات الزوايا في الصور باستخدام الصناديق المحدودة المدورة، وغالبًا ما يتم تطبيقها على الصور الجوية وصور الأقمار الصناعية. على عكس المربعات المحيطية التقليدية، يمكن للمربعات المحيطية الموجهة أن تناسب الأجسام في اتجاهات مختلفة.
- DOTA-v2: مجموعة بيانات الصور الجوية الشهيرة OBB مع 1.7 مليون حالة و11,268 صورة.
- DOTA8: مجموعة فرعية أصغر من أول 8 صور من مجموعة DOTAv1 المقسمة، 4 للتدريب و4 للتحقق من الصحة، وهي مناسبة للاختبارات السريعة.
التتبع متعدد الكائنات
التتبع متعدد الأجسام هو تقنية رؤية حاسوبية تتضمن اكتشاف وتتبع أجسام متعددة على مدار الوقت في تسلسل فيديو. تعمل هذه المهمة على توسيع نطاق اكتشاف الأجسام من خلال الحفاظ على هويات متسقة للأجسام عبر الإطارات.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية لمهام التتبع متعدد الأجسام.
- VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
المساهمة بمجموعات بيانات جديدة
تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:
شاهد: كيفية المساهمة في مجموعات بيانات Ultralytics 🚀
خطوات المساهمة بمجموعة بيانات جديدة
- جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
- قم بتعليق الصور: قم بتعليق هذه الصور باستخدام المربعات المحدودة أو المقاطع أو النقاط الرئيسية، حسب المهمة.
- تصدير التعليقات التوضيحية: تحويل هذه التعليقات التوضيحية إلى YOLO
*.txt
تنسيق الملف الذي يدعمه Ultralytics . -
تنظيم مجموعة البيانات: رتب مجموعة بياناتك في بنية المجلد الصحيح. يجب أن يكون لديك
train/
وval/
دلائل المستوى الأعلى، وداخل كل منها، دليلimages/
وlabels/
دليل فرعي. -
إنشاء
data.yaml
ملف: في الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاءdata.yaml
الذي يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى. - تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات من أجل معالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا الأمر غير مطلوب، ولكن يوصى به للحصول على أحجام أصغر لمجموعة البيانات وسرعات تنزيل أسرع.
- ضغط مجموعة البيانات: ضغط مجلد مجموعة البيانات بالكامل في ملف مضغوط.
- التوثيق والعلاقات العامة: أنشئ صفحة توثيق تصف مجموعة بياناتك وكيف تتناسب مع إطار العمل الحالي. بعد ذلك، أرسل طلب سحب (PR). راجع إرشادات المساهمةUltralytics للمزيد من التفاصيل حول كيفية تقديم طلب سحب العلاقات العامة.
مثال على كود لتحسين وضغط مجموعة البيانات
تحسين وضغط مجموعة البيانات
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
من خلال اتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع الهيكل الحالي Ultralytics'.
الأسئلة الشائعة
ما هي مجموعات البيانات التي يدعمها Ultralytics لاكتشاف الأجسام؟
يدعم Ultralytics مجموعة واسعة من مجموعات البيانات لاكتشاف الأجسام، بما في ذلك:
- COCO: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من فئات الكائنات.
- LVIS: مجموعة بيانات شاملة تحتوي على 1203 فئة من الكائنات، مصممة لاكتشاف الكائنات وتجزئتها بشكل أكثر دقة.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية.
- VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار.
- SKU-110K: يتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة بأكثر من 11 ألف صورة.
تسهل مجموعات البيانات هذه تدريب مجموعات بيانات قوية Ultralytics YOLO القوية لمختلف تطبيقات اكتشاف الأجسام.
كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics ؟
تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:
- جمع الصور: اجمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
- تعليق توضيحي للصور: قم بتطبيق المربعات المحيطة، أو المقاطع، أو النقاط الرئيسية، حسب المهمة.
- تصدير التعليقات التوضيحية: تحويل التعليقات التوضيحية إلى YOLO
*.txt
الشكل. - تنظيم مجموعة البيانات: استخدم بنية المجلد مع
train/
وval/
دلائل، يحتوي كل منها علىimages/
وlabels/
دلائل فرعية. - إنشاء
data.yaml
ملف: تضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة. - تحسين الصور (اختياري): تقليل حجم مجموعة البيانات لتحقيق الكفاءة.
- ضغط مجموعة البيانات: ضغط مجموعة البيانات في ملف مضغوط.
- المستند والعلاقات العامة: قم بوصف مجموعة البيانات الخاصة بك وأرسل طلب سحب باتباع إرشادات المساهمةUltralytics .
قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.
لماذا يجب أن أستخدم Ultralytics HUB لمجموعة البيانات الخاصة بي؟
يوفر Ultralytics HUB ميزات قوية لإدارة مجموعة البيانات وتحليلها، بما في ذلك:
- إدارة مجموعات البيانات بسلاسة: قم بتحميل مجموعات بياناتك وتنظيمها وإدارتها في مكان واحد.
- تكامل التدريب الفوري: استخدام مجموعات البيانات التي تم تحميلها مباشرةً لتدريب النموذج دون إعداد إضافي.
- أدوات التصور: استكشاف وتصور صور مجموعة البيانات والشروح التوضيحية الخاصة بك.
- تحليل مجموعة البيانات: احصل على رؤى حول توزيع مجموعة البيانات وخصائصها.
تعمل المنصة على تبسيط عملية الانتقال من إدارة مجموعة البيانات إلى تدريب النماذج، مما يجعل العملية بأكملها أكثر كفاءة. تعرف على المزيد حول مجموعات بياناتUltralytics HUB Datasets.
ما هي الميزات الفريدة لنماذج Ultralytics YOLO للرؤية الحاسوبية؟
توفر نماذج Ultralytics YOLO العديد من الميزات الفريدة لمهام الرؤية الحاسوبية:
- أداء في الوقت الحقيقي: قدرات استدلال وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
- تعدد الاستخدامات: دعم مهام الكشف والتجزئة والتصنيف وتقدير الوضعية في إطار عمل موحد.
- نماذج مدربة مسبقًا: الوصول إلى نماذج عالية الأداء ومدربة مسبقاً لتطبيقات مختلفة، مما يقلل من وقت التدريب.
- دعم مجتمعي واسع النطاق: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها وتطويرها.
- تكامل سهل: واجهة برمجة تطبيقات بسيطة للتكامل مع المشاريع وسير العمل الحالي.
اكتشف المزيد حول نماذج YOLO على صفحة نماذجUltralytics .
كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics ؟
لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics ، اتبع هذا المثال البرمجي:
تحسين وضغط مجموعة البيانات
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
تساعد هذه العملية على تقليل حجم مجموعة البيانات لتخزين أكثر كفاءة وسرعات تنزيل أسرع. تعرف على المزيد حول كيفية تحسين وضغط مجموعة البيانات.