تخطي إلى المحتوى

مجموعات البيانات

توفر مجموعات البيانات في Ultralytics Platform حلاً مبسطًا لإدارة بيانات التدريب الخاصة بك. بمجرد تحميلها، يمكن استخدام مجموعات البيانات على الفور لتدريب النماذج، مع المعالجة التلقائية وتوليد الإحصائيات.

تحميل مجموعة البيانات

تقبل Ultralytics تنسيقات تحميل متعددة من أجل المرونة.

تنسيقات الصور المدعومة

التنسيقالامتداداتملاحظات
JPEG.jpg, .jpegالأكثر شيوعًا، الموصى به
PNG.pngيدعم الشفافية
WebP.webpحديثة، ضغط جيد
BMP.bmpغير مضغوط
GIF.gifالإطار الأول المستخرج
مهرجان تورونتو السينمائي الدولي.tiff, .tifجودة عالية
HEIC.heicصور iPhone
AVIF.avifتنسيق الجيل التالي
JP2.jp2JPEG 2000
DNG.dngكاميرا خام

تنسيقات الفيديو المدعومة

يتم استخراج مقاطع الفيديو تلقائيًا إلى إطارات:

التنسيقالامتداداتاستخراج
MP4.mp41 إطار في الثانية، بحد أقصى 100 إطار
WebM.webm1 إطار في الثانية، بحد أقصى 100 إطار
MOV.mov1 إطار في الثانية، بحد أقصى 100 إطار
AVI.avi1 إطار في الثانية، بحد أقصى 100 إطار
MKV.mkv1 إطار في الثانية، بحد أقصى 100 إطار
M4V.m4v1 إطار في الثانية، بحد أقصى 100 إطار

حدود حجم الملف

النوعالحجم الأقصى
الصور50 ميغابايت لكل منها
مقاطع الفيديو1 غيغابايت لكل منها
ملفات ZIP50 جيجابايت

الأرشيف

يتم دعم ملفات ZIP التي يصل حجمها إلى 50 جيجابايت مع الحفاظ على بنية المجلدات والاستخراج والمعالجة التلقائية.

إعداد مجموعة بياناتك

بالنسبة لمجموعات البيانات الموسومة، استخدم تنسيق YOLO القياسي:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

يحدد ملف YAML تكوين مجموعة البيانات الخاصة بك:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

عملية الرفع

  1. انتقل إلى مجموعات البيانات في الشريط الجانبي
  2. انقر على تحميل مجموعة بيانات أو اسحب الملفات إلى منطقة التحميل
  3. حدد نوع المهمة (detect، segment، pose، OBB، classify)
  4. أضف اسمًا ووصفًا اختياريًا
  5. انقر على تحميل

بعد التحميل، تقوم المنصة بمعالجة بياناتك:

  1. التطبيع: يتم تغيير حجم الصور الكبيرة (بحد أقصى 4096 بكسل)
  2. الصور المصغرة: يتم إنشاء معاينات بحجم 256 بكسل
  3. تحليل التسميات: يتم استخراج تسميات بتنسيق YOLO
  4. الإحصائيات: يتم حساب توزيعات الفئات
التحقق قبل التحميل

يمكنك التحقق من صحة مجموعة بياناتك محليًا قبل التحميل:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

تصفح الصور

عرض صور مجموعة بياناتك في تخطيطات متعددة:

عرضالوصف
شبكةشبكة صور مصغرة مع تراكبات التعليقات التوضيحية
مضغوطصور مصغرة أصغر للمسح السريع
جدولقائمة تتضمن اسم الملف والأبعاد وعدد التسميات

عارض بملء الشاشة

انقر على أي صورة لفتح العارض بملء الشاشة مع:

  • التنقل: مفاتيح الأسهم أو النقر للتصفح
  • البيانات الوصفية: اسم الملف، الأبعاد، التقسيم، عدد التسميات
  • التعليقات التوضيحية: تبديل رؤية التعليقات التوضيحية
  • توزيع الفئات: عدد التسميات لكل فئة

التصفية حسب التقسيم

تصفية الصور حسب تقسيم مجموعة البيانات الخاصة بها:

تقسيمالغرض
تدريبيستخدم لتدريب النموذج
التحققيستخدم للتحقق أثناء التدريب
اختباريُستخدم للتقييم النهائي
غير معروفلم يتم تعيين تقسيم

إحصائيات مجموعة البيانات

توفر علامة التبويب الإحصائيات تحليلاً تلقائيًا لمجموعة بياناتك:

توزيع الفئات

مخطط شريطي يوضح عدد التعليقات التوضيحية لكل فئة:

خريطة حرارية للمواقع

تصور لمكان ظهور التعليقات التوضيحية في الصور:

تحليل الأبعاد

مخطط مبعثر لأبعاد الصورة (العرض مقابل الارتفاع):

التخزين المؤقت للإحصائيات

يتم تخزين الإحصائيات مؤقتًا لمدة 5 دقائق. ستنعكس التغييرات على التعليقات التوضيحية بعد انتهاء صلاحية التخزين المؤقت.

تصدير مجموعة البيانات

صدّر مجموعة بياناتك بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت:

  1. افتح قائمة إجراءات مجموعة البيانات
  2. انقر على تصدير
  3. نزّل ملف NDJSON

يخزن تنسيق NDJSON كائن JSON واحدًا لكل سطر:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

راجع وثائق تنسيق Ultralytics NDJSON للحصول على المواصفات الكاملة.

URI مجموعة البيانات

الرجوع إلى مجموعات بيانات المنصة باستخدام ul:// تنسيق URI:

ul://username/datasets/dataset-slug

استخدم URI هذا لتدريب النماذج من أي مكان:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

تدريب في أي مكان باستخدام بيانات المنصة

في ul:// يعمل URI من أي بيئة:

  • الجهاز المحلي: تدرب على جهازك، يتم تنزيل البيانات تلقائيًا
  • Google Colab: الوصول إلى مجموعات بيانات المنصة الخاصة بك في الدفاتر
  • الخوادم البعيدة: تدرب على الأجهزة الافتراضية السحابية مع الوصول الكامل إلى مجموعة البيانات

إعدادات الرؤية

تحكم في من يمكنه رؤية مجموعة بياناتك:

إعدادالوصف
خاصيمكنك الوصول إليه فقط
عاميمكن لأي شخص عرضه في صفحة الاستكشاف

لتغيير مستوى الرؤية:

  1. افتح قائمة إجراءات مجموعة البيانات
  2. انقر على تعديل
  3. تبديل إعداد الرؤية
  4. انقر على حفظ

تعديل مجموعة البيانات

تحديث اسم مجموعة البيانات أو وصفها أو مستوى رؤيتها:

  1. افتح قائمة إجراءات مجموعة البيانات
  2. انقر على تعديل
  3. إجراء التغييرات
  4. انقر على حفظ

حذف مجموعة البيانات

حذف مجموعة بيانات لم تعد بحاجة إليها:

  1. افتح قائمة إجراءات مجموعة البيانات
  2. انقر على حذف
  3. تأكيد الحذف

المهملات والاستعادة

يتم نقل مجموعات البيانات المحذوفة إلى المهملات لمدة 30 يومًا. يمكنك استعادتها من صفحة المهملات في الإعدادات.

التدريب على مجموعة البيانات

ابدأ التدريب مباشرة من مجموعة البيانات الخاصة بك:

  1. انقر على تدريب النموذج في صفحة مجموعة البيانات
  2. حدد مشروعًا أو أنشئ مشروعًا جديدًا
  3. تكوين معلمات التدريب
  4. بدء التدريب

راجع التدريب السحابي للحصول على التفاصيل.

الأسئلة الشائعة

ماذا يحدث لبياناتي بعد الرفع؟

تتم معالجة بياناتك وتخزينها في المنطقة التي اخترتها (الولايات المتحدة، الاتحاد الأوروبي، أو AP). الصور هي:

  1. تم التحقق من صحة التنسيق والحجم
  2. يتم تطبيعها إذا كانت أكبر من 4096 بكسل (مع الحفاظ على نسبة العرض إلى الارتفاع)
  3. مخزنة باستخدام التخزين القابل للعنونة بالمحتوى (CAS) مع تجزئة SHA-256
  4. صور مصغرة يتم إنشاؤها بحجم 256 بكسل لتصفح سريع

كيف يعمل التخزين؟

منصة Ultralytics تستخدم التخزين القائم على المحتوى (CAS) للتخزين الفعال:

  • إلغاء التكرار: الصور المتطابقة التي يرفعها مستخدمون مختلفون يتم تخزينها مرة واحدة فقط
  • النزاهة: تجزئة SHA-256 تضمن سلامة البيانات
  • الكفاءة: تقلل تكاليف التخزين وتسرع المعالجة
  • إقليمي: تبقى البيانات في منطقتك المختارة (الولايات المتحدة، الاتحاد الأوروبي، أو AP)

هل يمكنني إضافة صور إلى مجموعة بيانات موجودة؟

نعم، استخدم زر إضافة صور في صفحة مجموعة البيانات لتحميل صور إضافية. سيتم حساب الإحصائيات الجديدة تلقائيًا.

كيف أنقل الصور بين مجموعات البيانات؟

استخدم ميزة التحديد بالجملة:

  1. حدد الصور في المعرض
  2. انقر على نقل أو نسخ
  3. حدد مجموعة البيانات الوجهة

ما هي تنسيقات التسميات المدعومة؟

منصة Ultralytics تدعم تسميات تنسيق YOLO:

المهمةالتنسيقمثال
الكشفclass cx cy w h0 0.5 0.5 0.2 0.3
تجزئةclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
الوضعclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
تصنيفهيكل الدليلtrain/cats/, train/dogs/

جميع الإحداثيات معيارية (نطاق 0-1). علامات رؤية الوضع: 0=غير مصنفة، 1=مصنفة ولكن محجوبة، 2=مصنفة ومرئية.



📅 تم الإنشاء قبل 20 أيام ✏️ تم التحديث قبل 12 أيام
glenn-jocherLaughing-q

تعليقات