Link to this sectionنظرة عامة على مجموعات البيانات#

توفر Ultralytics الدعم لمختلف مجموعات البيانات لتسهيل مهام الرؤية الحاسوبية مثل الكشف، وتجزئة المثيلات، والتجزئة الدلالية، وتقدير العمق، وتقدير الوضعية، والتصنيف، وتتبع الكائنات المتعددة. فيما يلي قائمة بمجموعات بيانات Ultralytics الرئيسية، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.

Watch: Ultralytics Datasets Overview

Link to this section كشف الكائنات #

يُعد كشف الكائنات عبر صناديق التحديد تقنية في الرؤية الحاسوبية تتضمن رصد وتحديد موقع الكائنات في الصورة عن طريق رسم صندوق تحديد حول كل كائن.

African-wildlife: مجموعة بيانات تحتوي على صور للحياة البرية الأفريقية، بما في ذلك الجاموس والفيلة ووحيد القرن والحمر الوحشية.
Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع تعليقات توضيحية غنية.
Brain-tumor: مجموعة بيانات للكشف عن أورام المخ تتضمن صور الرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل حول وجود الورم وموقعه وخصائصه.
COCO: مجموعة البيانات المعروفة باسم Common Objects in Context (COCO) هي مجموعة كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها، وتضم 80 فئة من الكائنات.
COCO8: مجموعة فرعية أصغر مكونة من أول 4 صور من بيانات التدريب والتحقق في COCO، وهي مناسبة للاختبارات السريعة.
COCO8-Grayscale: نسخة بتدرج الرمادي من COCO8 تم إنشاؤها عن طريق تحويل RGB إلى تدرج الرمادي، وهي مفيدة لتقييم النماذج أحادية القناة.
COCO8-Multispectral: نسخة متعددة الأطياف مكونة من 10 قنوات من COCO8 تم إنشاؤها عن طريق استكمال أطوال موجات RGB، وهي مفيدة لتقييم النماذج الحساسة للطيف.
COCO128: مجموعة فرعية أصغر مكونة من أول 128 صورة من بيانات تدريب COCO لعام 2017، وهي مناسبة للاختبارات.
Construction-PPE: مجموعة بيانات لصور مواقع البناء مشروحة بمعدات السلامة الرئيسية مثل الخوذات، والسترات، والقفازات، والأحذية، والنظارات الواقية، إلى جانب تصنيفات للمعدات المفقودة، مما يدعم تطوير نماذج الذكاء الاصطناعي للامتثال وحماية العمال.
Global Wheat 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لمسابقة Global Wheat Challenge 2020.
HomeObjects-3K: مجموعة بيانات للمشاهد الداخلية المشروحة التي تضم 12 عنصرًا منزليًا شائعًا، وهي مثالية لتطوير واختبار نماذج الرؤية الحاسوبية في أنظمة المنازل الذكية، والروبوتات، والواقع المعزز.
KITTI جديد: مجموعة بيانات شهيرة للقيادة الذاتية تتميز بمدخلات ستيريو وLiDAR وGPS/IMU، وتُستخدم لكشف الكائنات ثنائية الأبعاد في مشاهد طرق متنوعة.
LVIS: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها تضم 1203 فئة من الكائنات.
Medical-pills: مجموعة بيانات تحتوي على صور مصنفة للأقراص الطبية، مصممة للمساعدة في مهام مثل مراقبة جودة الأدوية، والفرز، وضمان الامتثال لمعايير الصناعة.
Objects365: مجموعة بيانات عالية الجودة وكبيرة النطاق لكشف الكائنات تضم 365 فئة من الكائنات وأكثر من 600 ألف صورة مشروحة.
OpenImagesV7: مجموعة بيانات شاملة من Google تضم 1.7 مليون صورة تدريب و42 ألف صورة تحقق.
RF100: معيار متنوع لكشف الكائنات يضم 100 مجموعة بيانات تغطي سبعة مجالات تصوير لتقييم شامل للنموذج.
Signature: مجموعة بيانات تضم صورًا لمستندات متنوعة مع توقيعات مشروحة، مما يدعم أبحاث التحقق من المستندات وكشف الاحتيال.
SKU-110K: مجموعة بيانات تتميز بكشف الكائنات الكثيفة في بيئات البيع بالتجزئة وتضم أكثر من 11 ألف صورة و1.7 مليون صندوق تحديد.
VisDrone: مجموعة بيانات تحتوي على بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور ملتقطة بطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
VOC: مجموعة بيانات Pascal Visual Object Classes (VOC) لكشف الكائنات وتجزئتها، وتضم 20 فئة من الكائنات وأكثر من 11 ألف صورة.
xView: مجموعة بيانات لكشف الكائنات في الصور العلوية تضم 60 فئة من الكائنات وأكثر من مليون كائن مشروح.

Link to this section تجزئة المثيلات #

تجزئة المثيلات هي تقنية في الرؤية الحاسوبية تتضمن تحديد وتعيين موقع الكائنات في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، فإن تجزئة المثيلات تميز بين مثيلات مختلفة لنفس الفئة.

Carparts-seg: مجموعة بيانات مخصصة لتحديد أجزاء المركبات، وتلبي احتياجات التصميم والتصنيع والبحث. وهي تخدم مهام كشف الكائنات والتجزئة على حد سواء.
COCO: مجموعة بيانات كبيرة النطاق مصممة لمهام كشف الكائنات والتجزئة والتعليق عليها مع أكثر من 200 ألف صورة مصنفة.
COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات تجزئة توضيحية.
COCO128-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 128 صورة COCO مع تعليقات تجزئة توضيحية.
Crack-seg: مجموعة بيانات مصممة خصيصًا للكشف عن الشقوق على الطرق والجدران، وهي قابلة للتطبيق على مهام كشف الكائنات والتجزئة.
Package-seg: مجموعة بيانات مخصصة لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لتطبيقات كشف الكائنات والتجزئة.

Link to this section التجزئة الدلالية #

تقوم التجزئة الدلالية بتعيين تسمية فئة لكل بكسل في الصورة، مما ينتج خرائط مشاهد كثيفة لتطبيقات مثل القيادة الذاتية، وتحليل المشاهد، ورسم خرائط الغطاء الأرضي.

Cityscapes: مجموعة بيانات للتجزئة الدلالية لمشاهد الشوارع الحضرية مع 19 فئة تدريب.
Cityscapes8: مجموعة فرعية مدمجة من Cityscapes مكونة من 8 صور للتحقق السريع من خط أنابيب التجزئة الدلالية.
ADE20K: مجموعة بيانات لتحليل المشاهد مع 150 فئة دلالية.

Link to this section تقدير العمق #

يتنبأ تقدير العمق أحادي العين بخريطة عمق لكل بكسل بالأمتار من صورة RGB واحدة، مما يدعم إعادة بناء المشهد ثلاثي الأبعاد، وملاحة الروبوتات، وتطبيقات الواقع المعزز/الافتراضي AR/VR.

NYU Depth V2: معيار قياسي للعمق الداخلي تم التقاطه باستخدام Microsoft Kinect v1.
KITTI: مشاهد واقعية خارجية للقيادة الذاتية مع عمق Velodyne LiDAR.
Depth8: مجموعة فرعية مدمجة مكونة من 8 صور من SUN RGB-D لإجراء فحوصات سريعة لخط سير العمل.

Link to this section تقدير الوضعية #

تقدير الوضعية هو تقنية تُستخدم لتحديد وضعية الكائن بالنسبة للكاميرا أو نظام إحداثيات العالم. يتضمن ذلك تحديد النقاط الرئيسية أو المفاصل على الكائنات، وخاصة البشر أو الحيوانات.

COCO: مجموعة بيانات كبيرة النطاق مع تعليقات توضيحية لوضعية الإنسان مصممة لمهام تقدير الوضعية.
COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضعية، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية لوضعية الإنسان.
Dog-pose: مجموعة بيانات شاملة تضم حوالي 8500 صورة تركز على الكلاب، مشروحة بـ 24 نقطة رئيسية لكل كلب، ومصممة لمهام تقدير الوضعية.
Hand-Keypoints: مجموعة بيانات موجزة تضم أكثر من 26000 صورة تركز على أيدي البشر، مشروحة بـ 21 نقطة رئيسية لكل يد، ومصممة لمهام تقدير الوضعية.
Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مشروحة بـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.

Link to this section التصنيف #

تصنيف الصور هو مهمة رؤية حاسوبية تتضمن تصنيف صورة إلى فئة واحدة أو أكثر من الفئات المحددة مسبقًا بناءً على محتواها المرئي.

Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة من الكائنات لمهام تصنيف الصور.
Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة من الكائنات والمزيد من الصور الصعبة.
CIFAR-10: مجموعة بيانات مكونة من 60 ألف صورة ملونة بحجم 32x32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة من الكائنات و600 صورة لكل فئة.
Fashion-MNIST: مجموعة بيانات تتكون من 70,000 صورة بتدرج الرمادي من 10 فئات أزياء لمهام تصنيف الصور.
ImageNet: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و20,000 فئة.
ImageNet-10: مجموعة فرعية أصغر من ImageNet مع 10 فئات لتسريع التجارب والاختبار.
Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة لتسريع التدريب والاختبار.
Imagewoof: مجموعة فرعية أكثر تحديًا من ImageNet تحتوي على 10 فئات من سلالات الكلاب لمهام تصنيف الصور.
MNIST: مجموعة بيانات مكونة من 70,000 صورة بتدرج الرمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
MNIST160: أول 8 صور لكل رقم (0-9) من كل من مجموعات التدريب والاختبار في MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.

Link to this section صناديق التحديد الموجهة (OBB)#

تعد صناديق التحديد الموجهة (OBB) طريقة في الرؤية الحاسوبية للكشف عن الكائنات المائلة في الصور باستخدام صناديق تحديد دوارة، وغالبًا ما تُطبق على الصور الجوية وصور الأقمار الصناعية. على عكس صناديق التحديد التقليدية، يمكن لـ OBB ملاءمة الكائنات بشكل أفضل عند اتجاهات مختلفة.

DOTA-v2: مجموعة بيانات شهيرة لصور OBB الجوية مع 1.7 مليون مثيل و11,268 صورة.
DOTA8: مجموعة فرعية أصغر مكونة من أول 8 صور من مجموعة بيانات DOTAv1، منها 4 للتدريب و4 للتحقق، وهي مناسبة للاختبارات السريعة.
DOTA128: مجموعة فرعية مكونة من 128 صورة من مجموعة بيانات DOTA مع 128 صورة للتدريب والتحقق، مما يوفر توازناً جيداً بين الحجم والتنوع لاختبار نماذج OBB.

Link to this section تتبع الكائنات المتعددة #

تتبع الكائنات المتعددة هو تقنية رؤية حاسوبية تتضمن كشف وتتبع كائنات متعددة بمرور الوقت في تسلسل فيديو. توسع هذه المهمة عملية كشف الكائنات من خلال الحفاظ على هويات متسقة للكائنات عبر الإطارات.

Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع تعليقات توضيحية غنية لمهام تتبع الكائنات المتعددة.
VisDrone: مجموعة بيانات تحتوي على بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور ملتقطة بطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

Link to this sectionالمساهمة بمجموعات بيانات جديدة#

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها الجيد مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:

Watch: How to Contribute to Ultralytics Datasets

Link to this sectionخطوات المساهمة بمجموعة بيانات جديدة#

جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمع هذه الصور من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
شرح الصور: قم بإضافة تعليقات توضيحية لهذه الصور باستخدام صناديق التحديد، أو التجزئة، أو النقاط الرئيسية، اعتماداً على المهمة.
تصدير التعليقات التوضيحية: قم بتحويل هذه التعليقات التوضيحية إلى تنسيق ملف YOLO *.txt الذي تدعمه Ultralytics.
تنظيم مجموعة البيانات: رتب مجموعة بياناتك في هيكل المجلد الصحيح. يجب أن يكون لديك أدلة رئيسية images/ و labels/، وداخل كل منهما دليل فرعي train/ و val/.
```
dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/
```
إنشاء ملف data.yaml: في الدليل الرئيسي لمجموعة بياناتك، قم بإنشاء ملف data.yaml يصف مجموعة البيانات والفئات وغيرها من المعلومات اللازمة.
تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا ليس مطلوباً، ولكنه موصى به لأحجام مجموعات البيانات الأصغر وسرعات تنزيل أسرع.
ضغط مجموعة البيانات: قم بضغط مجلد مجموعة البيانات بالكامل في ملف zip.
التوثيق و PR: قم بإنشاء صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيفية توافقها مع الإطار الحالي. بعد ذلك، قم بتقديم طلب سحب (PR). راجع Ultralytics Contribution Guidelines للحصول على مزيد من التفاصيل حول كيفية تقديم PR.

Link to this sectionنموذج كود لتحسين وضغط مجموعة بيانات#

تحسين وضغط مجموعة بيانات

   from pathlib import Path

   from ultralytics.data.utils import compress_one_image
   from ultralytics.utils.downloads import zip_directory

   # Define dataset directory
   path = Path("path/to/dataset")

   # Optimize images in dataset (optional)
   for f in path.rglob("*.jpg"):
       compress_one_image(f)

   # Zip dataset into 'path/to/dataset.zip'
   zip_directory(path)

باتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع هيكل Ultralytics الحالي.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعات البيانات التي تدعمها Ultralytics لكشف الكائنات؟#

تدعم Ultralytics مجموعة واسعة من مجموعات البيانات لـ كشف الكائنات، بما في ذلك:

COCO: مجموعة بيانات كبيرة النطاق لكشف الكائنات وتجزئتها والتعليق عليها مع 80 فئة من الكائنات.
LVIS: مجموعة بيانات واسعة النطاق مع 1203 فئة من الكائنات، مصممة لكشف وتجزئة الكائنات بشكل أكثر دقة.
Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وتنبؤ بالحركة من بيئات حضرية مع تعليقات توضيحية غنية.
VisDrone: مجموعة بيانات تحتوي على بيانات كشف الكائنات وتتبع الكائنات المتعددة من صور ملتقطة بطائرات بدون طيار.
SKU-110K: تتميز بكشف الكائنات الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO القوية لمختلف تطبيقات اكتشاف الكائنات.

Link to this sectionكيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics؟#

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

جمع الصور: اجمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
شرح الصور: طبق صناديق التحديد أو التجزئة أو النقاط الرئيسية، اعتماداً على المهمة.
تصدير التعليقات التوضيحية: حول التعليقات التوضيحية إلى تنسيق YOLO *.txt.
تنظيم مجموعة البيانات: استخدم هيكل المجلد مع أدلة train/ و val/، حيث يحتوي كل منها على أدلة فرعية images/ و labels/.
إنشاء ملف data.yaml: قم بتضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة.
تحسين الصور (اختياري): قلل حجم مجموعة البيانات لتحسين الكفاءة.
ضغط مجموعة البيانات: قم بضغط مجموعة البيانات في ملف zip.
التوثيق و PR: صف مجموعة البيانات الخاصة بك وقدم طلب سحب باتباع Ultralytics Contribution Guidelines.

تفضل بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

Link to this sectionلماذا يجب أن أستخدم منصة Ultralytics لمجموعة بياناتي؟#

توفر Ultralytics Platform ميزات قوية لإدارة وتحليل مجموعات البيانات، بما في ذلك:

إدارة سلسة لمجموعات البيانات: قم بتحميل مجموعات البيانات الخاصة بك وتنظيمها وإدارتها في مكان واحد.
تكامل فوري للتدريب: استخدم مجموعات البيانات التي تم تحميلها مباشرة لتدريب النماذج دون الحاجة إلى إعداد إضافي.
أدوات التصور: استكشف وصوّر صور مجموعات البيانات والتعليقات التوضيحية الخاصة بك.
تحليل مجموعات البيانات: احصل على رؤى حول توزيع وخصائص مجموعة البيانات الخاصة بك.

تعمل المنصة على تبسيط الانتقال من إدارة مجموعة البيانات إلى تدريب النماذج، مما يجعل العملية برمتها أكثر كفاءة. تعرف على المزيد حول Ultralytics Platform Datasets.

Link to this sectionما هي الميزات الفريدة لنماذج YOLO من Ultralytics لرؤية الحاسوب؟#

توفر نماذج YOLO من Ultralytics العديد من الميزات الفريدة لمهام computer vision:

الأداء في الوقت الفعلي: قدرات استدلال وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
تعدد الاستخدامات: دعم مهام الكشف، وتجزئة المثيلات، والتجزئة الدلالية، وتقدير العمق، والتصنيف، وتقدير الوضعية في إطار عمل موحد.
نماذج مدربة مسبقًا: الوصول إلى نماذج عالية الأداء ومدربة مسبقًا لمختلف التطبيقات، مما يقلل من وقت التدريب.
دعم مجتمعي واسع: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها والتطوير.
تكامل سهل: API بسيط للتكامل مع المشاريع وسير العمل الحالية.

اكتشف المزيد حول نماذج YOLO في صفحة Ultralytics Models.

Link to this sectionكيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics؟#

لتحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics، اتبع نموذج التعليمات البرمجية هذا:

تحسين وضغط مجموعة بيانات

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تساعد هذه العملية في تقليل حجم مجموعة البيانات لتحقيق تخزين أكثر كفاءة وسرعات تنزيل أسرع. تعرف على المزيد حول كيفية Optimize and Zip a Dataset.

المساهمون

GLglenn-jocher²³ RIRizwanMunawar¹⁴ LALaughing-q⁴ JKjk4e³ AYAyushExel² BOBovey0809¹ RAraimbekovm¹ PDpderrenger¹ FCfcakyon¹ LAlakshanthad¹ MAMatthewNoyce¹ BUBurhan-Q¹ ABabirami-vina¹

تم الإنشاء 12 نوفمبر 2023تم التحديث قبل 4 ساعات