تخطي إلى المحتوى

مجموعات البيانات

توفر مجموعات بيانات Ultralytics حلاً مبسطًا لإدارة بيانات التدريب الخاصة بك. بمجرد تحميلها، يمكن استخدام مجموعات البيانات على الفور لتدريب النماذج، مع المعالجة التلقائية وإنشاء الإحصاءات.


شاهد: تحميل مجموعات البيانات إلى Ultralytics

تحميل مجموعة البيانات

تقبل Ultralytics تنسيقات تحميل متعددة من أجل المرونة:

التنسيقالوصف
الصورملفات الصور الفردية (JPG، PNG، WebP، TIFF، RAW)
أرشيف ZIPمجلد مضغوط يحتوي على صور وتسميات اختيارية
فيديوملفات MP4 و AVI - إطارات مستخرجة بمعدل ~1 إطار في الثانية
YOLOهيكل YOLO القياسي مع التسميات

استخراج إطارات الفيديو

عند تحميل مقاطع الفيديو، يتم استخراج الإطارات تلقائيًا:

  • معدل الإطارات: ~1 إطار في الثانية
  • الحد الأقصى للإطارات: 100 إطار لكل فيديو
  • المعالجة: استخراج من جانب العميل قبل التحميل
  • التنسيق: إطارات محولة إلى تنسيق صور قياسي

هذا مثالي لإنشاء مجموعات بيانات تدريبية من لقطات المراقبة أو تسجيلات الحركة أو أي مصدر فيديو.

تحضير مجموعة البيانات الخاصة بك

بالنسبة لمجموعات البيانات الموسومة، استخدم YOLO القياسي:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

يحدد ملف YAML تكوين مجموعة البيانات الخاصة بك:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

عملية التحميل

  1. انتقل إلى مجموعات البيانات في الشريط الجانبي
  2. انقر فوق " تحميل مجموعة البيانات " أو اسحب الملفات إلى منطقة التحميل
  3. حدد نوع المهمة (detect segment، الوضع، OBB، classify)
  4. أضف اسمًا ووصفًا اختياريًا
  5. انقر فوق " تحميل"

بعد التحميل، تقوم المنصة بمعالجة بياناتك:

  1. التطبيع: تغيير حجم الصور الكبيرة (بحد أقصى 4096 بكسل)
  2. الصور المصغرة: معاينات 256 بكسل تم إنشاؤها
  3. تحليل التسميات: استخراج تسميات YOLO
  4. الإحصاءات: توزيعات الفصول المحسوبة
التحقق من الصحة قبل التحميل

يمكنك التحقق من صحة مجموعة البيانات محليًا قبل تحميلها:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

تصفح الصور

اعرض صور مجموعة البيانات الخاصة بك في تخطيطات متعددة:

عرضالوصف
الشبكةشبكة الصور المصغرة مع تراكبات التعليقات التوضيحية
مضغوطصور مصغرة أصغر حجماً للمسح السريع
الجدولقائمة بأسماء الملفات والأبعاد وعدد الملصقات

عارض الشاشة الكاملة

انقر على أي صورة لفتح العارض بملء الشاشة مع:

  • التنقل: مفاتيح الأسهم أو النقر للتصفح
  • البيانات الوصفية: اسم الملف، الأبعاد، التقسيم، عدد الملصقات
  • التعليقات التوضيحية: تبديل رؤية التعليقات التوضيحية
  • تفصيل الفصول: عدد العلامات لكل فصل

تصفية حسب التقسيم

تصفية الصور حسب تقسيم مجموعة البيانات الخاصة بها:

انقسامالغرض
تدريبتستخدم لتدريب النماذج
التحققيستخدم للتحقق من الصحة أثناء التدريب
اختبارتستخدم للتقييم النهائي
غير معروفلم يتم تعيين أي تقسيم

إحصائيات مجموعة البيانات

توفر علامة التبويب " الإحصائيات " تحليلاً تلقائياً لمجموعة البيانات الخاصة بك:

توزيع الفصول

مخطط شريطي يوضح عدد التعليقات التوضيحية لكل فئة:

خريطة الحرارة للموقع

تصور مكان ظهور التعليقات التوضيحية في الصور:

تحليل الأبعاد

مخطط مبعثر لأبعاد الصورة (العرض مقابل الارتفاع):

تخزين الإحصاءات مؤقتًا

يتم تخزين الإحصائيات في ذاكرة التخزين المؤقت لمدة 5 دقائق. ستظهر التغييرات التي يتم إجراؤها على التعليقات التوضيحية بعد انتهاء صلاحية ذاكرة التخزين المؤقت.

تصدير مجموعة البيانات

قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت:

  1. افتح قائمة إجراءات مجموعة البيانات
  2. انقر فوق " تصدير"
  3. تنزيل ملف NDJSON

يخزن تنسيق NDJSON كائن JSON واحد في كل سطر:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

انظر وثائق تنسيقUltralytics للحصول على المواصفات الكاملة.

URI مجموعة البيانات

مجموعات بيانات المنصة المرجعية باستخدام ul:// تنسيق URI:

ul://username/datasets/dataset-slug

استخدم عنوان URI هذا لتدريب النماذج من أي مكان:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

تدرب في أي مكان باستخدام بيانات المنصة

في ul:// يعمل URI من أي بيئة:

  • الجهاز المحلي: تدريب على أجهزتك، تنزيل البيانات تلقائيًا
  • Google : الوصول إلى مجموعات بيانات المنصة في دفاتر الملاحظات
  • خوادم بعيدة: تدريب على أجهزة افتراضية سحابية مع وصول كامل إلى مجموعة البيانات

إعدادات الرؤية

تحكم في من يمكنه رؤية مجموعة البيانات الخاصة بك:

إعدادالوصف
خاصأنت وحدك يمكنك الوصول إلى
عاميمكن لأي شخص المشاهدة على صفحة "استكشاف"

لتغيير الرؤية:

  1. فتح قائمة إجراءات مجموعة البيانات
  2. انقر فوق " تحرير"
  3. تبديل إعدادات الرؤية
  4. انقر فوق " حفظ"

تعديل مجموعة البيانات

تحديث اسم مجموعة البيانات أو وصفها أو ظهورها:

  1. فتح قائمة إجراءات مجموعة البيانات
  2. انقر فوق " تحرير"
  3. إجراء تغييرات
  4. انقر فوق " حفظ"

حذف مجموعة البيانات

حذف مجموعة بيانات لم تعد بحاجة إليها:

  1. فتح قائمة إجراءات مجموعة البيانات
  2. انقر فوق " حذف"
  3. تأكيد الحذف

حذف واستعادة

يتم نقل مجموعات البيانات المحذوفة إلى سلة المهملات لمدة 30 يومًا. يمكنك استعادتها من صفحة سلة المهملات في الإعدادات.

تدريب على مجموعة البيانات

ابدأ التدريب مباشرة من مجموعة البيانات الخاصة بك:

  1. انقر على نموذج القطار في صفحة مجموعة البيانات
  2. اختر مشروعًا أو أنشئ مشروعًا جديدًا
  3. تكوين معلمات التدريب
  4. ابدأ التدريب

انظر تدريب السحابة للحصول على التفاصيل.

الأسئلة الشائعة

ماذا يحدث لبياناتي بعد تحميلها؟

تتم معالجة بياناتك وتخزينها في المنطقة التي اخترتها (الولايات المتحدة أو الاتحاد الأوروبي أو AP). الصور هي:

  1. تم التحقق من صحة الشكل والحجم
  2. يتم تطبيعه إذا كان أكبر من 4096 بكسل (مع الحفاظ على نسبة العرض إلى الارتفاع)
  3. يتم تخزينها باستخدام التخزين القابل للعنونة بالمحتوى (CAS) مع تجزئة SHA-256
  4. تم إنشاء الصور المصغرة بحجم 256 بكسل لتصفح سريع
  5. لا يتم مشاركتها أبدًا دون إذنك

كيف يعمل التخزين؟

تستخدم Ultralytics التخزين القابل للعنونة بالمحتوى (CAS) من أجل التخزين الفعال:

  • إزالة التكرار: يتم تخزين الصور المتطابقة التي تم تحميلها من قبل مستخدمين مختلفين مرة واحدة فقط
  • النزاهة: يضمن التجزئة SHA-256 سلامة البيانات
  • الكفاءة: يقلل من تكاليف التخزين ويسرع المعالجة
  • إقليمي: تظل البيانات في المنطقة التي حددتها (الولايات المتحدة أو الاتحاد الأوروبي أو AP)

هل يمكنني إضافة صور إلى مجموعة بيانات موجودة؟

نعم، استخدم زر "إضافة صور " في صفحة مجموعة البيانات لتحميل صور إضافية. سيتم حساب الإحصائيات الجديدة تلقائيًا.

كيف يمكنني نقل الصور بين مجموعات البيانات؟

استخدم ميزة التحديد الجماعي:

  1. حدد الصور في المعرض
  2. انقر فوق " نقل " أو " نسخ"
  3. حدد مجموعة البيانات الوجهة

ما هي تنسيقات الملصقات المدعومة؟

تدعم Ultralytics تسميات YOLO :

  • الكشف: class_id x_center y_center width height
  • تجزئة: class_id x1 y1 x2 y2 ... (نقاط المضلع)
  • الوضع: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

جميع الإحداثيات معيارية (نطاق 0-1).



📅 تم إنشاؤه منذ 0 أيام ✏️ تم التحديث منذ 0 أيام
glenn-jocher

تعليقات