مجموعات البيانات
توفر مجموعات البيانات في Ultralytics Platform حلاً مبسطًا لإدارة بيانات التدريب الخاصة بك. بمجرد تحميلها، يمكن استخدام مجموعات البيانات على الفور لتدريب النماذج، مع المعالجة التلقائية وتوليد الإحصائيات.
تحميل مجموعة البيانات
تقبل Ultralytics تنسيقات تحميل متعددة من أجل المرونة.
تنسيقات الصور المدعومة
| التنسيق | الامتدادات | ملاحظات |
|---|---|---|
| JPEG | .jpg, .jpeg | الأكثر شيوعًا، الموصى به |
| PNG | .png | يدعم الشفافية |
| WebP | .webp | حديثة، ضغط جيد |
| BMP | .bmp | غير مضغوط |
| GIF | .gif | الإطار الأول المستخرج |
| مهرجان تورونتو السينمائي الدولي | .tiff, .tif | جودة عالية |
| HEIC | .heic | صور iPhone |
| AVIF | .avif | تنسيق الجيل التالي |
| JP2 | .jp2 | JPEG 2000 |
| DNG | .dng | كاميرا خام |
تنسيقات الفيديو المدعومة
يتم استخراج مقاطع الفيديو تلقائيًا إلى إطارات:
| التنسيق | الامتدادات | استخراج |
|---|---|---|
| MP4 | .mp4 | 1 إطار في الثانية، بحد أقصى 100 إطار |
| WebM | .webm | 1 إطار في الثانية، بحد أقصى 100 إطار |
| MOV | .mov | 1 إطار في الثانية، بحد أقصى 100 إطار |
| AVI | .avi | 1 إطار في الثانية، بحد أقصى 100 إطار |
| MKV | .mkv | 1 إطار في الثانية، بحد أقصى 100 إطار |
| M4V | .m4v | 1 إطار في الثانية، بحد أقصى 100 إطار |
حدود حجم الملف
| النوع | الحجم الأقصى |
|---|---|
| الصور | 50 ميغابايت لكل منها |
| مقاطع الفيديو | 1 غيغابايت لكل منها |
| ملفات ZIP | 50 جيجابايت |
الأرشيف
يتم دعم ملفات ZIP التي يصل حجمها إلى 50 جيجابايت مع الحفاظ على بنية المجلدات والاستخراج والمعالجة التلقائية.
إعداد مجموعة بياناتك
بالنسبة لمجموعات البيانات الموسومة، استخدم تنسيق YOLO القياسي:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
يحدد ملف YAML تكوين مجموعة البيانات الخاصة بك:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
عملية الرفع
- انتقل إلى مجموعات البيانات في الشريط الجانبي
- انقر على تحميل مجموعة بيانات أو اسحب الملفات إلى منطقة التحميل
- حدد نوع المهمة (detect، segment، pose، OBB، classify)
- أضف اسمًا ووصفًا اختياريًا
- انقر على تحميل
بعد التحميل، تقوم المنصة بمعالجة بياناتك:
- التطبيع: يتم تغيير حجم الصور الكبيرة (بحد أقصى 4096 بكسل)
- الصور المصغرة: يتم إنشاء معاينات بحجم 256 بكسل
- تحليل التسميات: يتم استخراج تسميات بتنسيق YOLO
- الإحصائيات: يتم حساب توزيعات الفئات
التحقق قبل التحميل
يمكنك التحقق من صحة مجموعة بياناتك محليًا قبل التحميل:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
تصفح الصور
عرض صور مجموعة بياناتك في تخطيطات متعددة:
| عرض | الوصف |
|---|---|
| شبكة | شبكة صور مصغرة مع تراكبات التعليقات التوضيحية |
| مضغوط | صور مصغرة أصغر للمسح السريع |
| جدول | قائمة تتضمن اسم الملف والأبعاد وعدد التسميات |
عارض بملء الشاشة
انقر على أي صورة لفتح العارض بملء الشاشة مع:
- التنقل: مفاتيح الأسهم أو النقر للتصفح
- البيانات الوصفية: اسم الملف، الأبعاد، التقسيم، عدد التسميات
- التعليقات التوضيحية: تبديل رؤية التعليقات التوضيحية
- توزيع الفئات: عدد التسميات لكل فئة
التصفية حسب التقسيم
تصفية الصور حسب تقسيم مجموعة البيانات الخاصة بها:
| تقسيم | الغرض |
|---|---|
| تدريب | يستخدم لتدريب النموذج |
| التحقق | يستخدم للتحقق أثناء التدريب |
| اختبار | يُستخدم للتقييم النهائي |
| غير معروف | لم يتم تعيين تقسيم |
إحصائيات مجموعة البيانات
توفر علامة التبويب الإحصائيات تحليلاً تلقائيًا لمجموعة بياناتك:
توزيع الفئات
مخطط شريطي يوضح عدد التعليقات التوضيحية لكل فئة:
خريطة حرارية للمواقع
تصور لمكان ظهور التعليقات التوضيحية في الصور:
تحليل الأبعاد
مخطط مبعثر لأبعاد الصورة (العرض مقابل الارتفاع):
التخزين المؤقت للإحصائيات
يتم تخزين الإحصائيات مؤقتًا لمدة 5 دقائق. ستنعكس التغييرات على التعليقات التوضيحية بعد انتهاء صلاحية التخزين المؤقت.
تصدير مجموعة البيانات
صدّر مجموعة بياناتك بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت:
- افتح قائمة إجراءات مجموعة البيانات
- انقر على تصدير
- نزّل ملف NDJSON
يخزن تنسيق NDJSON كائن JSON واحدًا لكل سطر:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
راجع وثائق تنسيق Ultralytics NDJSON للحصول على المواصفات الكاملة.
URI مجموعة البيانات
الرجوع إلى مجموعات بيانات المنصة باستخدام ul:// تنسيق URI:
ul://username/datasets/dataset-slug
استخدم URI هذا لتدريب النماذج من أي مكان:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
تدريب في أي مكان باستخدام بيانات المنصة
في ul:// يعمل URI من أي بيئة:
- الجهاز المحلي: تدرب على جهازك، يتم تنزيل البيانات تلقائيًا
- Google Colab: الوصول إلى مجموعات بيانات المنصة الخاصة بك في الدفاتر
- الخوادم البعيدة: تدرب على الأجهزة الافتراضية السحابية مع الوصول الكامل إلى مجموعة البيانات
إعدادات الرؤية
تحكم في من يمكنه رؤية مجموعة بياناتك:
| إعداد | الوصف |
|---|---|
| خاص | يمكنك الوصول إليه فقط |
| عام | يمكن لأي شخص عرضه في صفحة الاستكشاف |
لتغيير مستوى الرؤية:
- افتح قائمة إجراءات مجموعة البيانات
- انقر على تعديل
- تبديل إعداد الرؤية
- انقر على حفظ
تعديل مجموعة البيانات
تحديث اسم مجموعة البيانات أو وصفها أو مستوى رؤيتها:
- افتح قائمة إجراءات مجموعة البيانات
- انقر على تعديل
- إجراء التغييرات
- انقر على حفظ
حذف مجموعة البيانات
حذف مجموعة بيانات لم تعد بحاجة إليها:
- افتح قائمة إجراءات مجموعة البيانات
- انقر على حذف
- تأكيد الحذف
المهملات والاستعادة
يتم نقل مجموعات البيانات المحذوفة إلى المهملات لمدة 30 يومًا. يمكنك استعادتها من صفحة المهملات في الإعدادات.
التدريب على مجموعة البيانات
ابدأ التدريب مباشرة من مجموعة البيانات الخاصة بك:
- انقر على تدريب النموذج في صفحة مجموعة البيانات
- حدد مشروعًا أو أنشئ مشروعًا جديدًا
- تكوين معلمات التدريب
- بدء التدريب
راجع التدريب السحابي للحصول على التفاصيل.
الأسئلة الشائعة
ماذا يحدث لبياناتي بعد الرفع؟
تتم معالجة بياناتك وتخزينها في المنطقة التي اخترتها (الولايات المتحدة، الاتحاد الأوروبي، أو AP). الصور هي:
- تم التحقق من صحة التنسيق والحجم
- يتم تطبيعها إذا كانت أكبر من 4096 بكسل (مع الحفاظ على نسبة العرض إلى الارتفاع)
- مخزنة باستخدام التخزين القابل للعنونة بالمحتوى (CAS) مع تجزئة SHA-256
- صور مصغرة يتم إنشاؤها بحجم 256 بكسل لتصفح سريع
كيف يعمل التخزين؟
منصة Ultralytics تستخدم التخزين القائم على المحتوى (CAS) للتخزين الفعال:
- إلغاء التكرار: الصور المتطابقة التي يرفعها مستخدمون مختلفون يتم تخزينها مرة واحدة فقط
- النزاهة: تجزئة SHA-256 تضمن سلامة البيانات
- الكفاءة: تقلل تكاليف التخزين وتسرع المعالجة
- إقليمي: تبقى البيانات في منطقتك المختارة (الولايات المتحدة، الاتحاد الأوروبي، أو AP)
هل يمكنني إضافة صور إلى مجموعة بيانات موجودة؟
نعم، استخدم زر إضافة صور في صفحة مجموعة البيانات لتحميل صور إضافية. سيتم حساب الإحصائيات الجديدة تلقائيًا.
كيف أنقل الصور بين مجموعات البيانات؟
استخدم ميزة التحديد بالجملة:
- حدد الصور في المعرض
- انقر على نقل أو نسخ
- حدد مجموعة البيانات الوجهة
ما هي تنسيقات التسميات المدعومة؟
منصة Ultralytics تدعم تسميات تنسيق YOLO:
| المهمة | التنسيق | مثال |
|---|---|---|
| الكشف | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| تجزئة | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| الوضع | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| تصنيف | هيكل الدليل | train/cats/, train/dogs/ |
جميع الإحداثيات معيارية (نطاق 0-1). علامات رؤية الوضع: 0=غير مصنفة، 1=مصنفة ولكن محجوبة، 2=مصنفة ومرئية.