إعداد البيانات

يُعد إعداد البيانات حجر الأساس لنجاح نماذج الرؤية الحاسوبية. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءاً من الرفع ومروراً بالتعليق التوضيحي (annotation) ووصولاً إلى التحليل.



Watch: Get Started with Ultralytics Platform - Data

نظرة عامة

يساعدك قسم البيانات في منصة Ultralytics على:

  • رفع الصور ومقاطع الفيديو وملفات مجموعات البيانات (ZIP و TAR بما في ذلك .tar.gz/.tgz و NDJSON)
  • التعليق التوضيحي باستخدام أدوات الرسم اليدوي والتوسيم الذكي المدعوم بـ SAM - اختر بين SAM 2.1 أو الإصدار الجديد SAM 3
  • تحليل بياناتك باستخدام الإحصائيات والتصورات
  • تصدير البيانات بـ تنسيق NDJSON للتدريب المحلي

نظرة عامة على بيانات منصة Ultralytics - الشريط الجانبي لمجموعات البيانات

سير العمل

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
المرحلةالوصف
التحميلاستيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية
التعليق التوضيحيتوسيم البيانات باستخدام الأدوات اليدوية لأنواع المهام الخمس، أو استخدام تعليق SAM التوضيحي للاكتشاف (detect) والتقسيم (segment) و OBB
تحليلعرض توزيعات الفئات، والخرائط الحرارية المكانية، وإحصائيات الأبعاد
التصديرتنزيل البيانات بـ تنسيق NDJSON للاستخدام دون اتصال بالإنترنت

المهام المدعومة

تدعم منصة Ultralytics جميع أنواع مهام YOLO الخمس:

المهمةالوصفأداة التعليق التوضيحي
الاكتشاف (Detect)اكتشاف الكائنات باستخدام مربعات الإحاطة (BBox)أداة المستطيل
التقسيم (Segment)تقسيم الحالات (instance segmentation) باستخدام أقنعة البكسلأداة المضلع
الوضعية (Pose)تقدير النقاط الرئيسية مع قوالب الهيكل العظمي المدمجة والمخصصةأداة النقاط الرئيسية
OBBمربعات إحاطة موجهة للكائنات المستديرةأداة الصندوق الموجه
التصنيف (Classify)تصنيف على مستوى الصورةمحدد الفئات
اختيار نوع المهمة

يتم تعيين نوع المهمة عند إنشاء مجموعة بيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييرها لاحقاً من محدد مهام رأس مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.

الميزات الرئيسية

التخزين الذكي

تستخدم منصة Ultralytics التخزين القائم على المحتوى (CAS) لإدارة فعالة للبيانات:

  • إزالة التكرار: يتم تخزين الصور المتطابقة مرة واحدة فقط عبر تجزئة XXH3-128
  • النزاهة: تضمن العنونة القائمة على التجزئة سلامة البيانات
  • الكفاءة: تخزين محسّن ومعالجة سريعة

معرفات موارد (URIs) لمجموعة البيانات

يمكنك الإشارة إلى مجموعات البيانات باستخدام تنسيق URI ul:// (راجع استخدام مجموعات بيانات المنصة):

yolo train data=ul://username/datasets/my-dataset

يسمح هذا بالتدريب على مجموعات بيانات المنصة من أي جهاز تم تكوين مفتاح API الخاص بك عليه.

استخدام بيانات المنصة من Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

إصدارات مجموعات البيانات

أنشئ لقطات NDJSON غير قابلة للتغيير لمجموعة بياناتك من أجل تدريب قابل للتكرار. يلتقط كل إصدار أعداد الصور، وأعداد الفئات، وأعداد التعليقات التوضيحية في وقت الإنشاء. راجع علامة تبويب الإصدارات للحصول على التفاصيل.

علامات تبويب مجموعة البيانات

يمكن أن تعرض صفحات مجموعة البيانات ما يصل إلى ست علامات تبويب، اعتماداً على حالة مجموعة البيانات وأذوناتك:

علامة التبويبالوصف
الصورتصفح الصور في عرض شبكي أو مدمج أو جدولي مع تراكبات التعليق التوضيحي
الفئاتعرض وتعديل أسماء الفئات، والألوان، وأعداد التسميات لكل فئة
المخططاتإحصائيات تلقائية: توزيع التقسيم، أعداد الفئات، الخرائط الحرارية
النماذجالنماذج المدربة على مجموعة البيانات هذه مع المقاييس والحالة
الإصداراتإنشاء وتنزيل لقطات NDJSON غير قابلة للتغيير للتدريب القابل للتكرار
الأخطاءالصور التي فشلت في المعالجة مع تفاصيل الخطأ وتوجيهات الإصلاح

Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.

التجميع (Clustering)

استكشف مجموعة بياناتك كمخطط مبعثر ثنائي الأبعاد تفاعلي حيث تتقارب الصور المتشابهة بصرياً - وهو أمر مفيد لكشف المجموعات والتكرارات والقيم المتطرفة، ولتفحص كيفية توزيع التقسيمات أو الفئات عبر بياناتك. استخدم أداة lasso على منطقة من المخطط لتصفية المعرض لتلك الصور. راجع التجميع لمزيد من التفاصيل.

الإحصائيات والتصور

The Charts tab provides automatic analysis including:

  • توزيع التقسيم: مخطط دائري لأعداد صور التدريب/التحقق/الاختبار
  • أهم الفئات: مخطط دائري لفئات التعليق التوضيحي الأكثر تكراراً
  • عرض الصور: رسم بياني لتوزيع عرض الصور
  • ارتفاع الصور: رسم بياني لتوزيع ارتفاع الصور
  • النقاط لكل حالة: توزيع عدد رؤوس المضلع أو النقاط الرئيسية (مجموعات بيانات التقسيم/الوضعية)
  • مواقع التعليق التوضيحي: خريطة حرارية ثنائية الأبعاد لمواقع مراكز مربعات الإحاطة
  • أبعاد الصورة: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط إرشاد لنسبة العرض إلى الارتفاع

روابط سريعة

الأسئلة الشائعة

ما هي تنسيقات الملفات المدعومة للرفع؟

تدعم منصة Ultralytics:

الصور: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (بحد أقصى 50 ميجابايت لكل منها)

مقاطع الفيديو: MP4, WebM, MOV, AVI, MKV, M4V (بحد أقصى 1 جيجابايت، يتم استخراج الإطارات بمعدل 1 FPS، وبحد أقصى 100 إطار)

ملفات مجموعات البيانات: أرشيفات ZIP أو TAR بما في ذلك .tar.gz و .tgz (بحد أقصى 10 جيجابايت في الإصدار المجاني، 20 جيجابايت في Pro، 50 جيجابايت في Enterprise) تحتوي على صور مع تسميات بتنسيق YOLO اختيارية، بالإضافة إلى تصديرات NDJSON

ما هو الحد الأقصى لحجم مجموعة البيانات؟

تعتمد حدود التخزين على خطتك:

الخطةحد التخزين
مجاني100 جيجابايت
Pro500 جيجابايت
Enterpriseغير محدود

حدود الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، مجموعات البيانات 10 جيجابايت في الإصدار المجاني / 20 جيجابايت في Pro / 50 جيجابايت في Enterprise

هل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟

نعم! استخدم تنسيق URI الخاص بمجموعة البيانات للتدريب محلياً:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

أو قم بتصدير مجموعة بياناتك بـ تنسيق NDJSON للتدريب دون اتصال بالإنترنت تماماً.

التعليقات