مجموعات البيانات
توفر مجموعات بيانات Ultralytics حلاً مبسطًا لإدارة بيانات التدريب الخاصة بك. بمجرد تحميلها، يمكن استخدام مجموعات البيانات على الفور لتدريب النماذج، مع المعالجة التلقائية وإنشاء الإحصاءات.
شاهد: تحميل مجموعات البيانات إلى Ultralytics
تحميل مجموعة البيانات
تقبل Ultralytics تنسيقات تحميل متعددة من أجل المرونة:
| التنسيق | الوصف |
|---|---|
| الصور | ملفات الصور الفردية (JPG، PNG، WebP، TIFF، RAW) |
| أرشيف ZIP | مجلد مضغوط يحتوي على صور وتسميات اختيارية |
| فيديو | ملفات MP4 و AVI - إطارات مستخرجة بمعدل ~1 إطار في الثانية |
| YOLO | هيكل YOLO القياسي مع التسميات |
استخراج إطارات الفيديو
عند تحميل مقاطع الفيديو، يتم استخراج الإطارات تلقائيًا:
- معدل الإطارات: ~1 إطار في الثانية
- الحد الأقصى للإطارات: 100 إطار لكل فيديو
- المعالجة: استخراج من جانب العميل قبل التحميل
- التنسيق: إطارات محولة إلى تنسيق صور قياسي
هذا مثالي لإنشاء مجموعات بيانات تدريبية من لقطات المراقبة أو تسجيلات الحركة أو أي مصدر فيديو.
تحضير مجموعة البيانات الخاصة بك
بالنسبة لمجموعات البيانات الموسومة، استخدم YOLO القياسي:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
يحدد ملف YAML تكوين مجموعة البيانات الخاصة بك:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
عملية التحميل
- انتقل إلى مجموعات البيانات في الشريط الجانبي
- انقر فوق " تحميل مجموعة البيانات " أو اسحب الملفات إلى منطقة التحميل
- حدد نوع المهمة (detect segment، الوضع، OBB، classify)
- أضف اسمًا ووصفًا اختياريًا
- انقر فوق " تحميل"
بعد التحميل، تقوم المنصة بمعالجة بياناتك:
- التطبيع: تغيير حجم الصور الكبيرة (بحد أقصى 4096 بكسل)
- الصور المصغرة: معاينات 256 بكسل تم إنشاؤها
- تحليل التسميات: استخراج تسميات YOLO
- الإحصاءات: توزيعات الفصول المحسوبة
التحقق من الصحة قبل التحميل
يمكنك التحقق من صحة مجموعة البيانات محليًا قبل تحميلها:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
تصفح الصور
اعرض صور مجموعة البيانات الخاصة بك في تخطيطات متعددة:
| عرض | الوصف |
|---|---|
| الشبكة | شبكة الصور المصغرة مع تراكبات التعليقات التوضيحية |
| مضغوط | صور مصغرة أصغر حجماً للمسح السريع |
| الجدول | قائمة بأسماء الملفات والأبعاد وعدد الملصقات |
عارض الشاشة الكاملة
انقر على أي صورة لفتح العارض بملء الشاشة مع:
- التنقل: مفاتيح الأسهم أو النقر للتصفح
- البيانات الوصفية: اسم الملف، الأبعاد، التقسيم، عدد الملصقات
- التعليقات التوضيحية: تبديل رؤية التعليقات التوضيحية
- تفصيل الفصول: عدد العلامات لكل فصل
تصفية حسب التقسيم
تصفية الصور حسب تقسيم مجموعة البيانات الخاصة بها:
| انقسام | الغرض |
|---|---|
| تدريب | تستخدم لتدريب النماذج |
| التحقق | يستخدم للتحقق من الصحة أثناء التدريب |
| اختبار | تستخدم للتقييم النهائي |
| غير معروف | لم يتم تعيين أي تقسيم |
إحصائيات مجموعة البيانات
توفر علامة التبويب " الإحصائيات " تحليلاً تلقائياً لمجموعة البيانات الخاصة بك:
توزيع الفصول
مخطط شريطي يوضح عدد التعليقات التوضيحية لكل فئة:
خريطة الحرارة للموقع
تصور مكان ظهور التعليقات التوضيحية في الصور:
تحليل الأبعاد
مخطط مبعثر لأبعاد الصورة (العرض مقابل الارتفاع):
تخزين الإحصاءات مؤقتًا
يتم تخزين الإحصائيات في ذاكرة التخزين المؤقت لمدة 5 دقائق. ستظهر التغييرات التي يتم إجراؤها على التعليقات التوضيحية بعد انتهاء صلاحية ذاكرة التخزين المؤقت.
تصدير مجموعة البيانات
قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت:
- افتح قائمة إجراءات مجموعة البيانات
- انقر فوق " تصدير"
- تنزيل ملف NDJSON
يخزن تنسيق NDJSON كائن JSON واحد في كل سطر:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
انظر وثائق تنسيقUltralytics للحصول على المواصفات الكاملة.
URI مجموعة البيانات
مجموعات بيانات المنصة المرجعية باستخدام ul:// تنسيق URI:
ul://username/datasets/dataset-slug
استخدم عنوان URI هذا لتدريب النماذج من أي مكان:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
تدرب في أي مكان باستخدام بيانات المنصة
في ul:// يعمل URI من أي بيئة:
- الجهاز المحلي: تدريب على أجهزتك، تنزيل البيانات تلقائيًا
- Google : الوصول إلى مجموعات بيانات المنصة في دفاتر الملاحظات
- خوادم بعيدة: تدريب على أجهزة افتراضية سحابية مع وصول كامل إلى مجموعة البيانات
إعدادات الرؤية
تحكم في من يمكنه رؤية مجموعة البيانات الخاصة بك:
| إعداد | الوصف |
|---|---|
| خاص | أنت وحدك يمكنك الوصول إلى |
| عام | يمكن لأي شخص المشاهدة على صفحة "استكشاف" |
لتغيير الرؤية:
- فتح قائمة إجراءات مجموعة البيانات
- انقر فوق " تحرير"
- تبديل إعدادات الرؤية
- انقر فوق " حفظ"
تعديل مجموعة البيانات
تحديث اسم مجموعة البيانات أو وصفها أو ظهورها:
- فتح قائمة إجراءات مجموعة البيانات
- انقر فوق " تحرير"
- إجراء تغييرات
- انقر فوق " حفظ"
حذف مجموعة البيانات
حذف مجموعة بيانات لم تعد بحاجة إليها:
- فتح قائمة إجراءات مجموعة البيانات
- انقر فوق " حذف"
- تأكيد الحذف
حذف واستعادة
يتم نقل مجموعات البيانات المحذوفة إلى سلة المهملات لمدة 30 يومًا. يمكنك استعادتها من صفحة سلة المهملات في الإعدادات.
تدريب على مجموعة البيانات
ابدأ التدريب مباشرة من مجموعة البيانات الخاصة بك:
- انقر على نموذج القطار في صفحة مجموعة البيانات
- اختر مشروعًا أو أنشئ مشروعًا جديدًا
- تكوين معلمات التدريب
- ابدأ التدريب
انظر تدريب السحابة للحصول على التفاصيل.
الأسئلة الشائعة
ماذا يحدث لبياناتي بعد تحميلها؟
تتم معالجة بياناتك وتخزينها في المنطقة التي اخترتها (الولايات المتحدة أو الاتحاد الأوروبي أو AP). الصور هي:
- تم التحقق من صحة الشكل والحجم
- يتم تطبيعه إذا كان أكبر من 4096 بكسل (مع الحفاظ على نسبة العرض إلى الارتفاع)
- يتم تخزينها باستخدام التخزين القابل للعنونة بالمحتوى (CAS) مع تجزئة SHA-256
- تم إنشاء الصور المصغرة بحجم 256 بكسل لتصفح سريع
- لا يتم مشاركتها أبدًا دون إذنك
كيف يعمل التخزين؟
تستخدم Ultralytics التخزين القابل للعنونة بالمحتوى (CAS) من أجل التخزين الفعال:
- إزالة التكرار: يتم تخزين الصور المتطابقة التي تم تحميلها من قبل مستخدمين مختلفين مرة واحدة فقط
- النزاهة: يضمن التجزئة SHA-256 سلامة البيانات
- الكفاءة: يقلل من تكاليف التخزين ويسرع المعالجة
- إقليمي: تظل البيانات في المنطقة التي حددتها (الولايات المتحدة أو الاتحاد الأوروبي أو AP)
هل يمكنني إضافة صور إلى مجموعة بيانات موجودة؟
نعم، استخدم زر "إضافة صور " في صفحة مجموعة البيانات لتحميل صور إضافية. سيتم حساب الإحصائيات الجديدة تلقائيًا.
كيف يمكنني نقل الصور بين مجموعات البيانات؟
استخدم ميزة التحديد الجماعي:
- حدد الصور في المعرض
- انقر فوق " نقل " أو " نسخ"
- حدد مجموعة البيانات الوجهة
ما هي تنسيقات الملصقات المدعومة؟
تدعم Ultralytics تسميات YOLO :
- الكشف:
class_id x_center y_center width height - تجزئة:
class_id x1 y1 x2 y2 ...(نقاط المضلع) - الوضع:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
جميع الإحداثيات معيارية (نطاق 0-1).