تخطي إلى المحتوى

إعداد البيانات

يُعد إعداد البيانات أساس نجاح نماذج رؤية الكمبيوتر. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءًا من التحميل ومرورًا بالتعليقات التوضيحية وصولاً إلى التحليل.

نظرة عامة

يساعدك قسم البيانات في منصة Ultralytics على:

  • تحميل الصور والفيديوهات والأرشيفات (ZIP، TAR، GZ)
  • قم بالتعليق باستخدام أدوات الرسم اليدوية والتوسيم الذكي SAM
  • تحليل بياناتك باستخدام الإحصائيات والتصورات
  • تصدير بتنسيق NDJSON للتدريب المحلي

نظرة عامة على بيانات Ultralytics مجموعات البيانات في الشريط الجانبي

سير العمل

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
المرحلةالوصف
تحميلاستيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية
التعليق التوضيحيتصنيف البيانات باستخدام مربعات الإحاطة أو المضلعات أو النقاط الرئيسية أو التصنيفات
تحليلعرض توزيعات الفئات، وخرائط الحرارة المكانية، وإحصائيات الأبعاد
تصديرتنزيل بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت

المهام المدعومة

تدعم منصة Ultralytics جميع أنواع مهام YOLO الخمسة:

المهمةالوصفأداة التوسيم
الكشفاكتشاف الكائنات باستخدام الصناديق المحيطةأداة المستطيل
تجزئةتجزئة الكائنات باستخدام أقنعة البكسلأداة المضلع
الوضعتقدير النقاط الرئيسية (تنسيق COCO المكون من 17 نقطة)أداة النقطة الرئيسية
OBBالصناديق المحيطة الموجهة للكائنات المدورةأداة الصندوق الموجه
تصنيفتصنيف على مستوى الصورةمحدد الفئة

اختيار نوع المهمة

يتم تعيين نوع المهمة عند إنشاء مجموعة البيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييره لاحقًا من إعدادات مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.

الميزات الرئيسية

التخزين الذكي

تستخدم Ultralytics التخزين القابل للعنونة بالمحتوى (CAS) لإدارة البيانات بكفاءة:

  • إزالة التكرار: تخزين الصور المتطابقة مرة واحدة فقط عبر التجزئة XXH3-128
  • النزاهة: يضمن العنونة القائمة على التجزئة سلامة البيانات
  • الكفاءة: تخزين محسن ومعالجة سريعة

معرفات URI لمجموعات البيانات

مجموعات البيانات المرجعية باستخدام ul:// تنسيق URI (انظر استخدام مجموعات بيانات المنصة):

yolo train data=ul://username/datasets/my-dataset

وهذا يتيح التدريب على مجموعات بيانات المنصة من أي جهاز تم تكوين مفتاح API الخاص بك عليه.

استخدام بيانات المنصة من Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

علامات تبويب مجموعة البيانات

تحتوي كل صفحة من صفحات مجموعة البيانات على خمس علامات تبويب:

علامة التبويبالوصف
الصورتصفح الصور في عرض الشبكة أو العرض المضغوط أو عرض الجدول مع تراكب التعليقات التوضيحية
الفصول الدراسيةعرض وتحرير أسماء الفئات والألوان وعدد الملصقات لكل فئة
الرسوم البيانيةإحصائيات تلقائية: توزيع مقسم، عدد الفئات، خرائط حرارية
النماذجنماذج تم تدريبها على هذه المجموعة من البيانات باستخدام المقاييس والحالة
الأخطاءالصور التي فشلت معالجتها مع تفاصيل الخطأ وإرشادات الإصلاح

الإحصائيات والتصور

في Charts توفر علامة التبويب تحليلاً تلقائياً يشمل:

  • التوزيع المقسم: مخطط دائري لعدد صور القطار/القيمة/الاختبار
  • الفئات الأعلى: مخطط دائري لأكثر فئات التعليقات التوضيحية شيوعًا
  • عرض الصور: رسم بياني لتوزيع عرض الصور
  • ارتفاعات الصورة: رسم بياني لتوزيع ارتفاعات الصورة
  • النقاط لكل حالة: توزيع عدد رءوس المضلعات أو النقاط الرئيسية (مجموعات بياناتsegment)
  • مواقع التعليقات التوضيحية: خريطة حرارية ثنائية الأبعاد لمواقع مركز المربع المحيط
  • أبعاد الصورة: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط إرشادية لنسبة العرض إلى الارتفاع

الأسئلة الشائعة

ما هي تنسيقات الملفات المدعومة للتحميل؟

تدعم منصة Ultralytics ما يلي:

الصور: JPEG، PNG، WebP، BMP، TIFF، HEIC، AVIF، JP2، DNG، MPO (بحد أقصى 50 ميجابايت لكل صورة)

مقاطع الفيديو: MP4، WebM، MOV، AVI، MKV، M4V (بحد أقصى 1 جيجابايت، إطارات مستخرجة بمعدل 1 إطار في الثانية، بحد أقصى 100 إطار)

الأرشيفات: ZIP، TAR، TAR.GZ، TGZ، GZ (بحد أقصى 10 جيجابايت) تحتوي على صور مع تسميات اختيارية YOLO

ما هو الحد الأقصى لحجم مجموعة البيانات؟

تعتمد حدود التخزين على خطتك:

الخطةحد التخزين
مجاني100 جيجابايت
احترافي500 جيجابايت
المؤسساتمخصص

حدود الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، الأرشيفات 10 جيجابايت

هل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟

نعم! استخدم تنسيق URI لمجموعة البيانات للتدريب محليًا:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

أو قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للتدريب دون اتصال بالإنترنت تمامًا.



📅 تم الإنشاء قبل 1 شهر ✏️ تم التحديث قبل 5 أيام
glenn-jochersergiuwaxmann

تعليقات