نظرة عامة على مجموعات البيانات
Ultralytics يوفر دعمًا لمجموعات بيانات متنوعة لتسهيل مهام الرؤية الحاسوبية مثل الكشف، وتجزئة المثيلات، وتقدير الوضع، والتصنيف، والتتبع متعدد الأجسام. فيما يلي قائمة بمجموعات البيانات الرئيسية Ultralytics ، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.
شاهد: Ultralytics نظرة عامة على مجموعات البيانات
Ultralytics المستكشف
مذكرة المجتمع ⚠️
اعتباراً من ultralytics>=8.3.10
، Ultralytics مستكشف الدعم قد تم إهماله. ولكن لا تقلق! يمكنك الآن الوصول إلى وظائف مماثلة بل ومحسنة من خلال Ultralytics هبمنصتنا البديهية الخالية من التعليمات البرمجية والمصممة لتبسيط سير عملك. مع Ultralytics HUB، يمكنك مواصلة استكشاف بياناتك وتصورها وإدارتها دون عناء، كل ذلك دون كتابة سطر واحد من التعليمات البرمجية. تأكد من التحقق من ذلك والاستفادة من ميزاته القوية!
أنشئ تضمينات لمجموعة البيانات الخاصة بك، وابحث عن الصور المتشابهة، وقم بتشغيل استعلامات SQL، وقم بإجراء بحث دلالي وحتى البحث باستخدام اللغة الطبيعية! يمكنك البدء باستخدام تطبيق واجهة المستخدم الرسومية أو إنشاء تطبيق خاص بك باستخدام واجهة برمجة التطبيقات. اعرف المزيد هنا.
- جرّب العرض التوضيحي لواجهة المستخدم الرسومية
- تعرف على المزيد حول واجهة برمجة تطبيقات المستكشف
اكتشاف الكائن
اكتشاف الأجسام في الصندوق المحدود هي تقنية رؤية حاسوبية تتضمن اكتشاف الأجسام في الصورة وتحديد موقعها من خلال رسم مربع محدد حول كل جسم.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية.
- COCO: الكائنات الشائعة في السياق (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من الكائنات.
- LVIS: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 1203 فئة من الكائنات.
- COCO8: مجموعة فرعية أصغر من أول 4 صور من تدريب COCO وCOCO val، مناسبة للاختبارات السريعة.
- COCO128: مجموعة فرعية أصغر من أول 128 صورة من أول 128 صورة من تدريب COCO وCOCO val، مناسبة للاختبارات.
- القمح العالمي 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح للتحدي العالمي للقمح 2020.
- Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق للكشف عن الكائنات مع 365 فئة من الكائنات وأكثر من 600 ألف صورة مشروحة.
- OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة تدريب و42 ألف صورة تحقق من صحتها.
- SKU-110K: مجموعة بيانات تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و1.7 مليون مربع محدد.
- VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
- VOC: مجموعة بيانات Pascal Visual Object Classes (VOC) للكشف عن الكائنات وتجزئتها مع 20 فئة من الكائنات وأكثر من 11 ألف صورة.
- xView: مجموعة بيانات للكشف عن الكائنات في الصور العلوية مع 60 فئة من الكائنات وأكثر من مليون كائن مشروح.
- RF100: معيار متنوع للكشف عن الأجسام يحتوي على 100 مجموعة بيانات تغطي سبعة مجالات تصوير لتقييم النموذج الشامل.
- أورام الدماغ: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور التصوير بالرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل عن وجود الورم وموقعه وخصائصه.
- الحياة البرية الأفريقية: مجموعة بيانات تضم صوراً للحياة البرية الأفريقية، بما في ذلك الجاموس، والفيل، ووحيد القرن، والحمير الوحشية.
- التوقيع: مجموعة بيانات تضم صوراً لوثائق مختلفة مع توقيعات مشروحة، لدعم أبحاث التحقق من المستندات والكشف عن الاحتيال.
تجزئة المثيل
تجزئة المثيل هي تقنية رؤية حاسوبية تتضمن تحديد وتوطين الأجسام في الصورة على مستوى البكسل.
- COCO: مجموعة بيانات واسعة النطاق مصممة لاكتشاف الأجسام وتجزئتها ومهام التسمية التوضيحية مع أكثر من 200 ألف صورة موسومة.
- COCO8-seg: مجموعة بيانات أصغر لمهام التجزئة على سبيل المثال، تحتوي على مجموعة فرعية من 8 صور COCO مع شروح التجزئة.
- COCO128-seg: مجموعة بيانات أصغر لمهام التجزئة على سبيل المثال، تحتوي على مجموعة فرعية من 128 صورة COCO مع شروح التجزئة.
- Crack-seg: مجموعة بيانات مصممة خصيصًا للكشف عن الشقوق على الطرق والجدران، وهي قابلة للتطبيق في كل من مهام الكشف عن الأجسام وتجزئتها.
- Package-seg: مجموعة بيانات مصممة خصيصًا لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لكل من تطبيقات اكتشاف الأجسام وتجزئتها.
- Carparts-seg: مجموعة بيانات مصممة خصيصًا لتحديد أجزاء المركبات، تلبي احتياجات التصميم والتصنيع والبحث. وهي تُستخدم في كل من مهام الكشف عن الكائنات وتجزئتها.
تقدير الوضعية
تقدير الوضعية هي تقنية تُستخدم لتحديد وضعية الجسم بالنسبة للكاميرا أو نظام الإحداثيات العالمي.
- COCO: مجموعة بيانات واسعة النطاق مع شروح الوضعية البشرية مصممة لمهام تقدير الوضعية.
- COCO8-pose: مجموعة بيانات أصغر حجماً لمهام تقدير الوضعية تحتوي على مجموعة فرعية من 8 صور COCO مع شروح الوضعية البشرية.
- Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مشروحة بـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.
- نقاط مفاتيح اليد: مجموعة بيانات موجزة تحتوي على أكثر من 26,000 صورة تتمحور حول الأيدي البشرية، مشروحة بـ 21 نقطة رئيسية لكل يد، مصممة لمهام تقدير الوضعية.
- وضعية الكلب: مجموعة بيانات شاملة تضم ما يقرب من 6000 صورة تركز على الكلاب، مشروحة بـ 24 نقطة رئيسية لكل كلب، مصممة خصيصًا لمهام تقدير الوضعية.
التصنيف
تصنيف الصور هو مهمة رؤية حاسوبية تتضمن تصنيف الصورة إلى فئة أو فئات محددة مسبقًا أو أكثر بناءً على محتواها المرئي.
- Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة من فئات الكائنات لمهام تصنيف الصور.
- كالتك 256: نسخة موسعة من Caltech 101 تحتوي على 256 فئة من الكائنات وصور أكثر تحدياً.
- CIFAR-10: مجموعة بيانات مكونة من 60 ألف صورة ملونة مقاس 32 × 32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
- CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة من فئات الكائنات و600 صورة لكل فئة.
- Fashion-MNIST: مجموعة بيانات تتألف من 70,000 صورة بتدرج الرمادي لـ 10 فئات من الأزياء لمهام تصنيف الصور.
- ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الأجسام وتصنيف الصور مع أكثر من 14 مليون صورة و20,000 فئة.
- ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
- Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة من أجل تدريب واختبار أسرع.
- Imagewoof: مجموعة فرعية أكثر صعوبة من ImageNet تحتوي على 10 فئات من سلالات الكلاب لمهام تصنيف الصور.
- MNIST: مجموعة بيانات تضم 70,000 صورة بتدرج الرمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
- MNIST160: أول 8 صور من كل فئة MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.
المربعات المحدودة الموجهة (OBB)
المربعات المحدودة الموجهة (OBB) هي طريقة في الرؤية الحاسوبية لاكتشاف الأجسام ذات الزوايا في الصور باستخدام مربعات محدّدة مدوّرة، وغالبًا ما يتم تطبيقها على الصور الجوية وصور الأقمار الصناعية.
- DOTA-v2: مجموعة بيانات الصور الجوية الشهيرة OBB مع 1.7 مليون حالة و11,268 صورة.
- DOTA8: مجموعة فرعية أصغر من أول 8 صور من مجموعة DOTAv1 المقسمة، 4 للتدريب و4 للتحقق من الصحة، وهي مناسبة للاختبارات السريعة.
التتبع متعدد الكائنات
التتبع متعدد الأجسام هو تقنية رؤية حاسوبية تتضمن اكتشاف وتتبع أجسام متعددة بمرور الوقت في تسلسل فيديو.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية لمهام التتبع متعدد الأجسام.
- VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
المساهمة بمجموعات بيانات جديدة
تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:
خطوات المساهمة بمجموعة بيانات جديدة
- جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
- قم بتعليق الصور: قم بتعليق هذه الصور باستخدام المربعات المحدودة أو المقاطع أو النقاط الرئيسية، حسب المهمة.
- تصدير التعليقات التوضيحية: تحويل هذه التعليقات التوضيحية إلى YOLO
*.txt
تنسيق الملف الذي يدعمه Ultralytics . -
تنظيم مجموعة البيانات: رتب مجموعة بياناتك في بنية المجلد الصحيح. يجب أن يكون لديك
train/
وval/
دلائل المستوى الأعلى، وداخل كل منها، دليلimages/
وlabels/
دليل فرعي. -
إنشاء
data.yaml
ملف: في الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاءdata.yaml
الذي يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى. - تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات من أجل معالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا الأمر غير مطلوب، ولكن يوصى به للحصول على أحجام أصغر لمجموعة البيانات وسرعات تنزيل أسرع.
- ضغط مجموعة البيانات: ضغط مجلد مجموعة البيانات بالكامل في ملف مضغوط.
- التوثيق والعلاقات العامة: أنشئ صفحة توثيق تصف مجموعة بياناتك وكيف تتناسب مع إطار العمل الحالي. بعد ذلك، أرسل طلب سحب (PR). راجع إرشادات المساهمةUltralytics للمزيد من التفاصيل حول كيفية تقديم طلب سحب العلاقات العامة.
مثال على كود لتحسين وضغط مجموعة البيانات
تحسين وضغط مجموعة البيانات
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
من خلال اتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع الهيكل الحالي Ultralytics'.
الأسئلة الشائعة
ما هي مجموعات البيانات التي يدعمها Ultralytics لاكتشاف الأجسام؟
Ultralytics يدعم مجموعة متنوعة من مجموعات البيانات للكشف عن الأجسام، بما في ذلك
- COCO: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من فئات الكائنات.
- LVIS: مجموعة بيانات شاملة تحتوي على 1203 فئة من الكائنات، مصممة لاكتشاف الكائنات وتجزئتها بشكل أكثر دقة.
- Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات التنبؤ بالحركة من البيئات الحضرية مع شروح غنية.
- VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار.
- SKU-110K: يتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة بأكثر من 11 ألف صورة.
تسهّل مجموعات البيانات هذه تدريب نماذج قوية لتطبيقات اكتشاف الأجسام المختلفة.
كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics ؟
تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:
- جمع الصور: اجمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
- تعليق توضيحي للصور: قم بتطبيق المربعات المحيطة، أو المقاطع، أو النقاط الرئيسية، حسب المهمة.
- تصدير التعليقات التوضيحية: تحويل التعليقات التوضيحية إلى YOLO
*.txt
الشكل. - تنظيم مجموعة البيانات: استخدم بنية المجلد مع
train/
وval/
دلائل، يحتوي كل منها علىimages/
وlabels/
دلائل فرعية. - إنشاء
data.yaml
ملف: تضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة. - تحسين الصور (اختياري): تقليل حجم مجموعة البيانات لتحقيق الكفاءة.
- ضغط مجموعة البيانات: ضغط مجموعة البيانات في ملف مضغوط.
- المستند والعلاقات العامة: قم بوصف مجموعة البيانات الخاصة بك وأرسل طلب سحب باتباع إرشادات المساهمةUltralytics .
قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.
لماذا يجب أن أستخدم Ultralytics Explorer لمجموعة البيانات الخاصة بي؟
Ultralytics يوفر Explorer ميزات قوية لتحليل مجموعة البيانات، بما في ذلك:
- توليد التضمينات: إنشاء تضمينات متجهة للصور.
- البحث الدلالي: البحث عن الصور المتشابهة باستخدام التضمينات أو الذكاء الاصطناعي.
- استعلامات SQL: تشغيل استعلامات SQL متقدمة لتحليل البيانات التفصيلية.
- بحث باللغة الطبيعية: البحث باستخدام استعلامات بلغة بسيطة لسهولة الاستخدام.
استكشفUltralytics Explorer لمزيد من المعلومات ولتجربة العرض التوضيحي لواجهة المستخدم الرسومية.
ما هي الميزات الفريدة لنماذج Ultralytics YOLO للرؤية الحاسوبية؟
Ultralytics YOLO توفر النماذج العديد من الميزات الفريدة:
- الأداء في الوقت الحقيقي: استدلال وتدريب عالي السرعة.
- تعدد الاستخدامات: مناسب لمهام الكشف والتجزئة والتصنيف وتقدير الوضعية.
- نماذج مدربة مسبقاً: الوصول إلى النماذج عالية الأداء والمدربة مسبقاً لمختلف التطبيقات.
- دعم مجتمعي واسع النطاق: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها وتطويرها.
اكتشف المزيد عن YOLO على Ultralytics YOLO الصفحة
كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics ؟
لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics ، اتبع هذا المثال البرمجي:
تحسين وضغط مجموعة البيانات
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
تعرف على المزيد حول كيفية تحسين مجموعة البيانات وضغطها.