مجموعات البيانات

توفر مجموعات بيانات Ultralytics Platform حلاً انسيابياً لإدارة بيانات التدريب الخاصة بك. بعد الرفع، تقوم المنصة بمعالجة الصور والتسميات والإحصائيات تلقائياً. تصبح مجموعة البيانات جاهزة للتدريب بمجرد اكتمال المعالجة واحتوائها على صورة واحدة على الأقل في تقسيم train، وصورة واحدة على الأقل في تقسيم val أو test، وصورة واحدة على الأقل مصنفة، وبإجمالي لا يقل عن صورتين.

رفع مجموعة البيانات

تقبل Ultralytics Platform تنسيقات رفع متعددة لضمان المرونة.

التنسيقات المدعومة

التنسيقالامتداداتملاحظاتالحد الأقصى للحجم
JPEG.jpg، .jpegالأكثر شيوعاً، موصى به50 ميجابايت
PNG.pngيدعم الشفافية50 ميجابايت
WebP.webpحديث، ضغط جيد50 ميجابايت
BMP.bmpغير مضغوط50 ميجابايت
TIFF.tiff, .tifجودة عالية50 ميجابايت
HEIC.heicصور iPhone50 ميجابايت
AVIF.avifتنسيق من الجيل التالي50 ميجابايت
JP2.jp2JPEG 200050 ميجابايت
DNG.dngصور الكاميرا الخام (Raw)50 ميجابايت
MPO.mpoكائن متعدد الصور50 ميجابايت

إعداد مجموعة البيانات الخاصة بك

تدعم المنصة Ultralytics YOLO، وCOCO، وUltralytics NDJSON، وعمليات الرفع الخام (غير المعنونة):

استخدم هيكل دليل YOLO القياسي مع ملف data.yaml:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

يحدد ملف YAML تكوين مجموعة البيانات الخاصة بك:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog
عمليات الرفع الخام

خام (Raw): رفع صور غير معنونة (بدون تسميات). مفيد عندما تخطط لإضافة التسميات مباشرة على المنصة باستخدام محرر التسميات.

هيكل الدليل المسطح

يمكنك أيضاً رفع الصور بدون مجلدات تقسيم صريحة. تحترم المنصة هدف التقسيم النشط أثناء الرفع، وبالنسبة لمجموعات البيانات غير الخاصة بالتصنيف، قد تقوم المنصة تلقائياً بإنشاء تقسيم للتحقق (validation split) من جزء من مجموعة التدريب عندما لا يتم توفير معلومات التقسيم. يمكنك دائماً إعادة تعيين الصور لاحقاً باستخدام النقل الجماعي إلى التقسيم أو إعادة توزيع التقسيم.

الكشف التلقائي عن التنسيق

يتم الكشف عن التنسيق تلقائياً: يتم التعامل مع مجموعات البيانات التي تحتوي على ملف data.yaml به مفاتيح names أو train أو val على أنها YOLO. يتم التعامل مع مجموعات البيانات التي تحتوي على ملفات COCO JSON (التي تحتوي على مصفوفات images وannotations وcategories) على أنها COCO. يتم استيراد ملفات تصدير .ndjson كـ Ultralytics NDJSON. يتم التعامل مع مجموعات البيانات التي تحتوي على صور فقط بدون تسميات على أنها خام (Raw).

للحصول على تفاصيل التنسيق الخاصة بكل مهمة، راجع المهام المدعومة ونظرة عامة على مجموعات البيانات.

عملية الرفع

  1. انتقل إلى Datasets في الشريط الجانبي
  2. انقر على New Dataset أو اسحب الملفات إلى منطقة الرفع
  3. اختر نوع المهمة (راجع المهام المدعومة)
  4. أضف اسماً ووصفاً اختيارياً
  5. حدد مستوى الرؤية (عام أو خاص) والترخيص الاختياري (راجع التراخيص المتاحة)
  6. انقر على Create

محدد مهمة حوار رفع مجموعات بيانات Ultralytics Platform

بعد الرفع، تعالج المنصة بياناتك عبر خط أنابيب متعدد المراحل:

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff
  1. التحقق (Validation): فحوصات التنسيق والحجم
  2. التطبيع (Normalization): تغيير حجم الصور الكبيرة (بحد أقصى 4096 بكسل، أصغر بُعد 28 بكسل)
  3. الصور المصغرة (Thumbnails): إنشاء معاينات WebP بحجم 256 بكسل
  4. تحليل التسميات: استخراج تسميات بتنسيق YOLO وCOCO
  5. الإحصائيات: حساب توزيعات الفئات وأبعاد الصور

شريط تقدم رفع مجموعات بيانات Ultralytics Platform

التحقق قبل الرفع

يمكنك التحقق من مجموعة البيانات الخاصة بك محلياً قبل الرفع:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")
متطلبات حجم الصورة

يجب ألا يقل طول أقصر جانب في الصور عن 28 بكسل. يتم رفض الصور الأصغر من ذلك أثناء المعالجة. يتم تغيير حجم الصور التي يزيد طول أطول جانب فيها عن 4096 بكسل تلقائياً مع الحفاظ على نسبة العرض إلى الارتفاع.

تصفح الصور

اعرض صور مجموعة البيانات الخاصة بك في تخطيطات متعددة.

افتح لوحة التجميع من شريط أدوات المعرض لاستكشاف مجموعة البيانات الخاصة بك كمخطط تشتت ثنائي الأبعاد تفاعلي.

عرضالوصف
شبكة (Grid)شبكة صور مصغرة مع تراكبات التسميات (الافتراضي)
مدمج (Compact)صور مصغرة أصغر للمسح السريع
جدول (Table)قائمة تحتوي على صورة مصغرة، واسم الملف، والأبعاد، والحجم، والتقسيم، والفئات، وعدد التسميات

عرض شبكة معرض مجموعات بيانات Ultralytics Platform مع التسميات

الفرز والتصفية

يمكن فرز الصور وتصفيتها للتصفح الفعال:

فرزالوصف
الأحدث / الأقدمترتيب الرفع / الإنشاء
الاسم أ-ي / ي-أاسم الملف أبجدياً
الارتفاع ↑/↓ارتفاع الصورة بالبكسل
العرض ↑/↓عرض الصورة بالبكسل
الحجم ↑/↓حجم الملف على القرص
التوضيحات ↑/↓عدد التوضيحات لكل صورة
مجموعات البيانات الكبيرة

بالنسبة لمجموعات البيانات التي تزيد عن 100,000 صورة، يتم تعطيل خيارات الفرز حسب الاسم / الحجم / العرض / الارتفاع للحفاظ على سرعة استجابة المعرض. تظل خيارات الفرز حسب الأحدث والأقدم وعدد التوضيحات متاحة.

العثور على الصور غير المصنفة

استخدم فلتر التسمية المعين على Unlabeled للعثور بسرعة على الصور التي لا تزال بحاجة إلى توضيح. يعد هذا مفيداً بشكل خاص لمجموعات البيانات الكبيرة حيث ترغب في تتبع تقدم التسمية.

عارض ملء الشاشة

انقر على أي صورة لفتح عارض ملء الشاشة مع:

  • التنقل: مفاتيح الأسهم أو معاينات الصور المصغرة للتصفح
  • البيانات الوصفية: اسم الملف، الأبعاد، شارة التقسيم، عدد التوضيحات
  • التوضيحات: تبديل رؤية تراكب التوضيحات
  • تصنيف الفئات: عدد التسميات لكل فئة مع مؤشرات الألوان
  • تعديل: أدخل وضع التوضيح لإضافة أو تعديل التسميات
  • تنزيل: تنزيل ملف الصورة الأصلي
  • حذف: حذف الصورة من مجموعة البيانات
  • تكبير: استخدم Cmd/Ctrl+Scroll أو Cmd/Ctrl++ أو Cmd/Ctrl+= للتكبير، و Cmd/Ctrl+- للتصغير
  • إعادة تعيين العرض: Cmd/Ctrl + 0 أو زر إعادة التعيين لملاءمة الصورة مع العارض
  • تحريك: اضغط مع الاستمرار على Space واسحب لتحريك اللوحة عند التكبير
  • عرض البكسل: تبديل عرض البكسل للفحص الدقيق

Ultralytics Platform Datasets Fullscreen Viewer With Metadata Panel

التصفية حسب التقسيم

تصفية الصور حسب تقسيم مجموعة البيانات الخاص بها:

التقسيمالغرض
التدريبيستخدم لتدريب النموذج
Valيستخدم للتحقق أثناء التدريب
Testيستخدم للتقييم النهائي

التجميع (Clustering)

تقوم لوحة Clustering بإسقاط مجموعة البيانات الخاصة بك في مخطط تشتت ثنائي الأبعاد تفاعلي حيث توضع الصور المتشابهة بصرياً بالقرب من بعضها البعض. استخدمها للكشف عن العناقيد، وتحديد النسخ المتكررة والقيم المتطرفة، وفحص كيفية توزيع التقسيمات أو الفئات عبر بياناتك - دون مغادرة المعرض. افتحها من أيقونة مخطط التشتت في شريط أدوات المعرض في أي صفحة مجموعة بيانات.

Ultralytics Platform Datasets Clustering Empty State

تشغيل التحليل

بدء تحليل:

  1. افتح مجموعة بيانات وانقر على أيقونة مخطط التشتت في شريط أدوات المعرض
  2. انقر على Analyze Dataset
  3. انتظر حتى ينتهي شريط التقدم - تظهر النتائج في نفس اللوحة

يتم تشغيل التحليل في الخلفية ويمكن أن يستغرق بضع دقائق اعتماداً على حجم مجموعة البيانات الخاصة بك. يمكنك إغلاق اللوحة أو مغادرة الصفحة والعودة لاحقاً.

التصور

بمجرد اكتمال التحليل، تعرض اللوحة مخطط تشتت ثنائي الأبعاد لجميع الصور التي تم تحليلها. تقوم فلاتر المعرض (التقسيم، الفئة، مصنفة/غير مصنفة) بتعتيم النقاط الخارجة عن نطاق الفلتر حتى تتمكن من التركيز على المجموعة الفرعية التي تهتم بها.

Ultralytics Platform Datasets Clustering Scatter Plot

التلوين حسب

قم بتغيير كيفية تظليل نقاط البيانات باستخدام القائمة المنسدلة Color by في شريط أدوات اللوحة. قم بتبديل أوضاع العرض في أي وقت - يعيد المخطط تلوين نفسه فوراً حتى تتمكن من رؤية كيفية توزيع التقسيمات أو الفئات أو خصائص الصور عبر عناقيدك:

الخيارالتظليل
التقسيماتتدريب / تحقق / اختبار
الفئاتفئة التوضيح الأولى في كل صورة
العرضعرض الصورة
الارتفاعارتفاع الصورة
الحجمحجم الملف
التعليقات التوضيحيةعدد التوضيحات لكل صورة

Ultralytics Platform Datasets Clustering Color Modes

اختيار لاسو (Lasso)

ارسم اختياراً حراً حول منطقة معينة لتمييز النقاط على المخطط. يتم تصفية المعرض وصولاً إلى الصور المطابقة، حتى تتمكن من فحصها أو إعادة تسميتها أو نقلها أو حذفها باستخدام عمليات الصور المعتادة.

مسح الاختيار

تظهر شريحة فوق المخطط توضح عدد النقاط المحددة - انقر على × لمسح أداة لاسو والعودة إلى عرض المعرض الكامل.

التحريك والتكبير

تنقل في مخططات التشتت الكبيرة مباشرة من خلال الماوس ولوحة المفاتيح:

الإدخالإجراء
تمريرتحريك المخطط في وضع ثنائي الأبعاد
Cmd/Ctrl+Scrollالتكبير أو التصغير، مع تثبيت النقطة عند المؤشر
استمرار الضغط على Spaceالتبديل إلى وضع السحب للتحريك

إعادة التحليل

إذا تغيرت مجموعة البيانات الخاصة بك بعد التحليل، يظهر زر Re-analyze في أعلى اللوحة للمالكين والمحررين.

انقر على Re-analyze لإعادة حساب التضمينات والإسقاط ثنائي الأبعاد من البداية.

علامات تبويب مجموعة البيانات

يمكن لكل صفحة مجموعة بيانات أن تعرض ما يصل إلى ست علامات تبويب، اعتماداً على حالة مجموعة البيانات وأذوناتك:

علامة تبويب الصور

العرض الافتراضي الذي يعرض معرض الصور مع تراكبات التوضيح. يدعم أوضاع عرض الشبكة والمدمجة والجدول. قم بسحب وإسقاط الملفات هنا لإضافة المزيد من الصور.

علامة تبويب الفئات

تظهر علامة التبويب هذه عندما تحتوي مجموعة البيانات على صور.

إدارة فئات التوضيح لمجموعة البيانات الخاصة بك:

  • رسم بياني للفئات: مخطط شريطي يعرض عدد التوضيحات لكل فئة مع إمكانية التبديل بين المقياس الخطي/اللوغاريتمي
  • جدول الفئات: جدول قابل للفرز والبحث يتضمن اسم الفئة وعدد التسميات وعدد الصور
  • تعديل أسماء الفئات: انقر على أي اسم فئة لإعادة تسميته داخلياً
  • تعديل ألوان الفئات: انقر على مربع اللون لتغيير لون الفئة
  • إضافة فئة جديدة: استخدم الإدخال في الأسفل لإضافة فئات

Ultralytics Platform Datasets Classes Tab Histogram And Table

المقياس اللوغاريتمي لمجموعات البيانات غير المتوازنة

إذا كانت مجموعة البيانات الخاصة بك تحتوي على خلل في توازن الفئات (على سبيل المثال، 10,000 توضيح لفئة "شخص" ولكن 50 فقط لفئة "دراجة")، استخدم تبديل Log Scale في الرسم البياني للفئات لتصور جميع الفئات بوضوح.

علامة تبويب المخططات

تظهر علامة التبويب هذه عندما تحتوي مجموعة البيانات على صور.

إحصائيات تلقائية تم حسابها من مجموعة البيانات الخاصة بك:

المخططالوصف
توزيع التقسيممخطط دائري لعدد صور التدريب/التحقق/الاختبار والنسبة المئوية المصنفة
أهم الفئاتمخطط دائري لأكثر 10 فئات تعليقات توضيحية تكراراً
عرض الصوررسم بياني لتوزيع عرض الصور مع المتوسط
ارتفاع الصوررسم بياني لتوزيع ارتفاع الصور مع المتوسط
النقاط لكل مثيلعدد رؤوس المضلع أو النقاط الرئيسية لكل تعليق توضيحي (تقسيم/وضعية)
مواقع التعليقات التوضيحيةخريطة حرارية ثنائية الأبعاد لمواقع مراكز صناديق الإحاطة (BBox)
أبعاد الصورةخريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط توجيهية لنسبة العرض إلى الارتفاع

Ultralytics Platform Datasets Charts Tab Statistics Grid

التخزين المؤقت للإحصائيات

يتم تخزين الإحصائيات مؤقتاً لمدة 5 دقائق. سيتم عكس التغييرات التي تطرأ على التعليقات التوضيحية بعد انتهاء صلاحية ذاكرة التخزين المؤقت.

الخرائط الحرارية بملء الشاشة

انقر فوق زر التوسيع في أي خريطة حرارية لعرضها في وضع ملء الشاشة. يوفر هذا رؤية أكبر وأكثر تفصيلاً، وهو أمر مفيد لفهم الأنماط المكانية في مجموعات البيانات الكبيرة.

علامة تبويب النماذج

اعرض جميع النماذج التي تم تدريبها على مجموعة البيانات هذه في جدول قابل للبحث:

العمودالوصف
الاسماسم النموذج مع الرابط
المشروعالمشروع الرئيسي مع الأيقونة
الحالةشارة حالة التدريب
المهمةنوع مهمة YOLO
الحقب (Epochs)أفضل حقبة / إجمالي الحقب
mAP50-95متوسط دقة الدقة (Mean average precision)
mAP50mAP عند IoU 0.50
تاريخ الإنشاءتاريخ الإنشاء

Ultralytics Platform Datasets Models Tab Trained Models Table

علامة تبويب الأخطاء

تظهر علامة التبويب هذه فقط عند فشل معالجة ملف واحد أو أكثر.

الصور التي فشلت معالجتها مدرجة هنا مع:

  • لافتة الخطأ: إجمالي عدد الصور الفاشلة والإرشادات
  • جدول الأخطاء: اسم الملف، ووصف الخطأ سهل الفهم، وتلميحات الإصلاح، والصورة المصغرة للمعاينة
  • تتضمن الأخطاء الشائعة الملفات التالفة، والتنسيقات غير المدعومة، والصور الصغيرة جداً (بحد أدنى 28 بكسل)، وأنماط الألوان غير المدعومة

Ultralytics Platform Datasets Errors Tab Processing Failures

أخطاء المعالجة الشائعة
الخطأالسببالإصلاح
غير قادر على قراءة ملف الصورةتالف أو تنسيق غير مدعومأعد التصدير من محرر الصور
غير مكتمل أو تالفتم اقتطاع الملف أثناء النقلأعد تنزيل الملف الأصلي
الصورة صغيرة جداًالحد الأدنى للأبعاد أقل من 28 بكسلاستخدم صور مصدر ذات دقة أعلى
نمط ألوان غير مدعومنمط ألوان CMYK أو مفهرستحويل إلى نمط RGB

علامة تبويب الإصدارات

أنشئ لقطات NDJSON غير قابلة للتغيير لمجموعة البيانات الخاصة بك من أجل تدريب قابل للتكرار. يلتقط كل إصدار عدد الصور، وعدد الفئات، وعدد التعليقات التوضيحية، وحجم الملف في وقت الإنشاء.

العمودالوصف
الإصداررقم الإصدار (v1, v2, ...)
الوصفوصف مقدم من المستخدم (قابل للتحرير)
الصورعدد الصور في وقت اللقطة
الفئاتعدد الفئات في وقت اللقطة
التعليقات التوضيحيةعدد التعليقات التوضيحية في وقت اللقطة
الحجمحجم ملف تصدير NDJSON
تاريخ الإنشاءمتى تم إنشاء الإصدار

لإنشاء إصدار:

  1. افتح علامة تبويب الإصدارات
  2. أدخل وصفاً اختيارياً (على سبيل المثال، "تمت إضافة 500 صورة تدريب" أو "تم إصلاح فئات ذات تسميات خاطئة")
  3. انقر فوق + إصدار جديد
  4. يظهر الإصدار الجديد في الجدول
  5. قم بتنزيل الإصدار بشكل منفصل من الجدول عند الحاجة

يتم ترقيم كل إصدار بالتسلسل (v1, v2, v3...) ويتم تخزينه بشكل دائم. يمكنك تنزيل أي إصدار سابق في أي وقت من جدول الإصدارات.

مجموعات البيانات الجاهزة فقط

إنشاء الإصدار متاح بعد وصول مجموعة البيانات إلى حالة ready.

متى تنشئ إصدارات

قم بإنشاء إصدار قبل وبعد التغييرات الرئيسية على مجموعة البيانات الخاصة بك - إضافة صور، أو إصلاح التعليقات التوضيحية، أو إعادة موازنة التقسيمات. يتيح لك هذا مقارنة أداء النموذج عبر حالات مجموعة بيانات مختلفة.

حجم ملف NDJSON

الحجم المعروض هو حجم ملف تصدير NDJSON، الذي يحتوي على روابط صور وتعليقات توضيحية - وليس الصور نفسها. يتم تخزين بيانات الصور الفعلية بشكل منفصل ويتم الوصول إليها عبر روابط موقعة.

تصدير مجموعة البيانات

قم بتصدير مجموعة البيانات الخاصة بك للاستخدام دون اتصال بالإنترنت باستخدام تنزيل NDJSON من رأس مجموعة البيانات أو علامة تبويب الإصدارات.

للتصدير:

  1. انقر فوق زر تصدير في رأس مجموعة البيانات
  2. قم بتنزيل لقطة NDJSON الحالية مباشرة
  3. استخدم علامة تبويب الإصدارات عندما تريد لقطة مرقمة غير قابلة للتغيير يمكنك إعادة تنزيلها لاحقاً

Ultralytics Platform Datasets Export Ndjson Download

يخزن تنسيق NDJSON كائن JSON واحداً لكل سطر. يحتوي السطر الأول على بيانات تعريف مجموعة البيانات، متبوعاً بسطر واحد لكل صورة:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}
روابط موقعة

روابط الصور في ملف NDJSON المُصدّر موقعة وصالحة لمدة 7 أيام. إذا كنت بحاجة إلى روابط جديدة، فأعد تصدير مجموعة البيانات أو أنشئ إصداراً جديداً.

راجع وثائق تنسيق Ultralytics NDJSON للحصول على المواصفات الكاملة.

عمليات الصور

إجراءات سريعة

انقر بزر الماوس الأيمن على أي صورة في عرض شبكة أو مدمج للوصول إلى الإجراءات السريعة:

إجراءالوصف
نقل إلى التقسيمإعادة تعيين الصورة إلى تقسيم التدريب (Train)، أو التحقق (Val)، أو الاختبار (Test)
تنزيلتنزيل ملف الصورة الأصلي
حذفحذف الصورة من مجموعة البيانات

Ultralytics Platform Datasets Image Card Context Menu

فردي مقابل جماعي

تعمل قائمة سياق الصورة على صورة واحدة. للعمليات الجماعية على صور متعددة، استخدم عرض الجدول (Table) مع تحديد خانة الاختيار.

نقل جماعي إلى تقسيم

إعادة تعيين الصور المحددة إلى تقسيم مختلف داخل نفس مجموعة البيانات:

  1. التبديل إلى عرض الجدول (Table)
  2. حدد الصور باستخدام خانات الاختيار
  3. انقر بزر الماوس الأيمن لفتح قائمة السياق
  4. اختر Move to split > Train أو Validation أو Test

يمكنك أيضًا سحب وإفلات الصور على علامات تبويب مرشح التقسيم في عرض الشبكة.

تنظيم تقسيمات التدريب/التحقق

قم بتحميل جميع الصور إلى مجموعة بيانات واحدة، ثم استخدم النقل الجماعي إلى التقسيم لتنظيم المجموعات الفرعية إلى تقسيمات التدريب والتحقق والاختبار.

إعادة توزيع التقسيم

أعد توزيع جميع الصور عبر تقسيمات التدريب والتحقق والاختبار باستخدام نسب مخصصة:

  1. انقر فوق شريط التقسيم (split bar) في شريط أدوات مجموعة البيانات لفتح مربع حوار إعادة توزيع التقسيمات (Redistribute Splits)
  2. اضبط نسب التقسيم باستخدام أي من الطرق أدناه
  3. راجع معاينة عدد الصور المباشرة لتأكيد التوزيع
  4. انقر فوق تطبيق (Apply) لإعادة تعيين جميع الصور عشوائيًا وفقًا لنسبك المئوية

Ultralytics Platform Datasets Split Redistribution Dialog

يوفر مربع الحوار ثلاث طرق لضبط نسب التقسيم المستهدفة:

الطريقةالوصف
سحب (Drag)اسحب المقابض بين الأجزاء الملونة لضبط حدود التقسيم بصريًا
كتابة (Type)قم بتحرير مدخل النسبة المئوية لأي تقسيم (يتم إعادة توازن التقسيمين الآخرين تلقائيًا بشكل متناسب)
تلقائي (Auto)نقرة واحدة لضبط تقسيم 80/20 للتدريب/التحقق فورًا مع ضبط تقسيم الاختبار على 0%

تظهر معاينة مباشرة عدد الصور التي ستنتقل بالضبط إلى كل تقسيم قبل التطبيق.

تقسيم سريع 80/20

انقر فوق زر Auto لضبط تقسيم 80/20 الموصى به للتدريب/التحقق فورًا. هذه هي النسبة الأكثر شيوعًا للتدريب.

حذف جماعي

حذف صور متعددة في وقت واحد:

  1. حدد الصور في عرض الجدول
  2. انقر بزر الماوس الأيمن واختر Delete
  3. تأكيد الحذف

معرف الموارد الموحد (URI) لمجموعة البيانات

أشر إلى مجموعات بيانات Platform باستخدام تنسيق URI ul:// (انظر Using Platform Datasets):

ul://username/datasets/dataset-slug

استخدم هذا الـ URI لتدريب النماذج من أي مكان:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
تدريب في أي مكان باستخدام بيانات Platform

يعمل الـ URI ul:// من أي بيئة:

  • جهاز محلي: التدريب على أجهزتك، ويتم تنزيل البيانات تلقائيًا
  • Google Colab: الوصول إلى مجموعات بيانات Platform الخاصة بك في دفاتر الملاحظات
  • خوادم بعيدة: التدريب على أجهزة سحابية افتراضية (VMs) مع وصول كامل إلى مجموعة البيانات

التراخيص المتاحة

تدعم Platform التراخيص التالية لمجموعات البيانات:

الترخيصالنوع
لا يوجدلم يتم اختيار ترخيص
CC0-1.0نطاق عام
CC-BY-2.5مسموح (Permissive)
CC-BY-4.0مسموح (Permissive)
CC-BY-SA-4.0حقوق النسخ (Copyleft)
CC-BY-NC-4.0غير تجاري
CC-BY-NC-SA-4.0حقوق النسخ (Copyleft)
CC-BY-ND-4.0بدون اشتقاقات
CC-BY-NC-ND-4.0غير تجاري
Apache-2.0مسموح (Permissive)
MITمسموح (Permissive)
AGPL-3.0حقوق النسخ (Copyleft)
GPL-3.0حقوق النسخ (Copyleft)
للبحث فقطمقيد
أخرىمخصص
تراخيص حقوق النسخ (Copyleft)

عند استنساخ مجموعة بيانات بترخيص حقوق نسخ (AGPL-3.0 أو GPL-3.0 أو CC-BY-SA-4.0 أو CC-BY-NC-SA-4.0)، يرث الاستنساخ الترخيص ويتم قفل محدد الترخيص.

إعدادات الرؤية

تحكم في من يمكنه رؤية مجموعة البيانات الخاصة بك:

الإعدادالوصف
خاص (Private)أنت فقط من يمكنه الوصول
عام (Public)يمكن لأي شخص المشاهدة على صفحة الاستكشاف (Explore)

يتم ضبط الرؤية عند إنشاء مجموعة بيانات في مربع حوار New Dataset باستخدام مفتاح تبديل. مجموعات البيانات العامة مرئية على صفحة Explore.

تحرير مجموعة البيانات

يتم تحرير بيانات وصف مجموعة البيانات ضمنيًا مباشرة في صفحة مجموعة البيانات — لا حاجة إلى مربع حوار:

  • الاسم: انقر فوق اسم مجموعة البيانات لتحريره. يتم حفظ التغييرات تلقائيًا عند إلغاء التحديد أو الضغط على Enter.
  • الوصف: انقر فوق الوصف (أو نص العنصر النائب "Add a description...") للتحرير. يتم حفظ التغييرات تلقائيًا.
  • نوع المهمة: انقر فوق شارة المهمة لاختيار نوع مهمة مختلف.
  • الترخيص: انقر فوق محدد الترخيص لتغيير ترخيص مجموعة البيانات.
تغيير نوع المهمة

تخزن كل صورة التعليقات التوضيحية لجميع أنواع المهام معًا. يؤدي تغيير نوع مهمة مجموعة البيانات إلى التحكم في التعليقات التوضيحية المرئية في المحرر والمضمنة في الصادرات والتدريب. يتم الاحتفاظ بالتعليقات التوضيحية لأنواع المهام الأخرى في قاعدة البيانات وتظهر مرة أخرى عند التبديل مرة أخرى.

استنساخ مجموعة البيانات

عند عرض مجموعة بيانات عامة لا تملكها، انقر فوق Clone Dataset لإنشاء نسخة في مساحة العمل الخاصة بك. يتضمن الاستنساخ جميع الصور والتعليقات التوضيحية وتعريفات الفئات. إذا كانت مجموعة البيانات الأصلية تحمل ترخيص حقوق نسخ، فإن الاستنساخ يرثه ويتم قفل محدد الترخيص.

تمييز ومشاركة

  • تمييز (Star): انقر فوق زر النجمة لإضافة مجموعة بيانات إلى المفضلة. عدد النجوم مرئي لجميع المستخدمين.
  • مشاركة: بالنسبة لمجموعات البيانات العامة، انقر فوق زر المشاركة لنسخ رابط أو المشاركة على منصات التواصل الاجتماعي.

حذف مجموعة البيانات

حذف مجموعة بيانات لم تعد بحاجة إليها:

  1. فتح قائمة إجراءات مجموعة البيانات
  2. انقر فوق Delete
  3. أكد في مربع الحوار: "سيؤدي هذا إلى نقل [name] إلى المهملات. يمكنك استعادته في غضون 30 يومًا."
المهملات والاستعادة

يتم نقل مجموعات البيانات المحذوفة إلى المهملات - ولا يتم حذفها نهائياً. يمكنك استعادتها خلال 30 يوماً من Settings > Trash.

التدريب على مجموعة بيانات

ابدأ التدريب مباشرة من مجموعة بياناتك:

  1. انقر على New Model في صفحة مجموعة البيانات
  2. اختر مشروعاً أو أنشئ مشروعاً جديداً
  3. تكوين معلمات التدريب
  4. بدء التدريب
graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

راجع Cloud Training للحصول على التفاصيل.

الأسئلة الشائعة

ماذا يحدث لبياناتي بعد التحميل؟

تتم معالجة بياناتك وتخزينها في المنطقة التي اخترتها (الولايات المتحدة، الاتحاد الأوروبي، أو آسيا والمحيط الهادئ). الصور يتم:

  1. التحقق من صحتها من حيث التنسيق والحجم
  2. رفضها إذا كان البعد الأدنى أقل من 28px
  3. تطبيعها (Normalization) إذا كانت أكبر من 4096px (مع الحفاظ على نسبة العرض إلى الارتفاع؛ وترميزها لتخزين محسن)
  4. تخزينها باستخدام التخزين المعتمد على المحتوى (CAS) مع تجزئة XXH3-128
  5. إنشاء صور مصغرة بتنسيق 256px WebP لتصفح سريع

كيف يعمل التخزين؟

تستخدم منصة Ultralytics التخزين المعتمد على المحتوى (CAS) للتخزين الفعال:

  • إزالة التكرار (Deduplication): يتم تخزين الصور المتطابقة التي يحملها مستخدمون مختلفون مرة واحدة فقط
  • السلامة: تضمن تجزئة XXH3-128 سلامة البيانات
  • الكفاءة: يقلل من تكاليف التخزين ويسرع المعالجة
  • إقليمي: تظل البيانات في المنطقة التي اخترتها (الولايات المتحدة، الاتحاد الأوروبي، أو آسيا والمحيط الهادئ)

هل يمكنني إضافة صور إلى مجموعة بيانات موجودة؟

نعم، قم بسحب وإفلات الملفات في صفحة مجموعة البيانات أو استخدم زر التحميل لإضافة صور إضافية. سيتم حساب الإحصائيات الجديدة تلقائياً.

كيف أنقل الصور بين مجموعات التقسيم (Splits)؟

استخدم ميزة النقل الجماعي إلى تقسيم:

  1. حدد الصور في عرض الجدول
  2. انقر بزر الماوس الأيمن واختر Move to split
  3. اختر التقسيم المستهدف (Train، Validation، أو Test)

ما هي تنسيقات التسميات المدعومة؟

تدعم منصة Ultralytics تسميات YOLO، وCOCO JSON، وUltralytics NDJSON، وتحميلات الصور الخام:

ملف .txt واحد لكل صورة بإحداثيات مطبعة (نطاق 0-1):

المهمةالتنسيقمثال
Detectclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Poseclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
Classifyهيكل الدليلtrain/cats/, train/dogs/

علامات رؤية وضعية الجسم (Pose visibility): 0=غير مسمى، 1=مسمى ولكنه محجوب، 2=مسمى ومرئي.

هل يمكنني وضع تعليقات توضيحية على نفس مجموعة البيانات لأنواع مهام متعددة؟

نعم. تخزن كل صورة تعليقات توضيحية لجميع أنواع المهام الخمس (detect، segment، pose، OBB، classify) معاً. يمكنك تبديل نوع المهمة النشطة لمجموعة البيانات في أي وقت دون فقدان التعليقات التوضيحية الموجودة. فقط التعليقات التوضيحية المطابقة لنوع المهمة النشطة تظهر في المحرر ويتم تضمينها في الصادرات والتدريب - يتم الاحتفاظ بالتعليقات التوضيحية للمهام الأخرى وتظهر مرة أخرى عند التبديل عودةً إليها.

التعليقات