تخطي إلى المحتوى

إعداد البيانات

يُعد إعداد البيانات أساس نجاح نماذج رؤية الكمبيوتر. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءًا من التحميل ومرورًا بالتعليقات التوضيحية وصولاً إلى التحليل.



شاهد: ابدأ مع Ultralytics - البيانات

نظرة عامة

يساعدك قسم البيانات في منصة Ultralytics على:

  • تحميل الصور ومقاطع الفيديو وملفات مجموعات البيانات (بصيغة ZIP وTAR بما في ذلك .tar.gz/.tgz، NDJSON)
  • وسم باستخدام أدوات الرسم اليدوية والوسم الذكي المدعوم بتقنية SAM — اختر من بين SAM 2.1 أو SAM 3 الجديد.
  • تحليل بياناتك باستخدام الإحصائيات والتصورات
  • تصدير بتنسيق NDJSON للتدريب المحلي.

نظرة عامة على بيانات Ultralytics مجموعات البيانات في الشريط الجانبي

سير العمل

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
المرحلةالوصف
تحميلاستيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية
التعليق التوضيحيقم بتسمية البيانات باستخدام أدوات يدوية لجميع أنواع المهام الخمسة، أو استخدم SAM detect segment و OBB.
تحليلعرض توزيعات الفئات، وخرائط الحرارة المكانية، وإحصائيات الأبعاد
تصديرتنزيل بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت

المهام المدعومة

تدعم منصة Ultralytics جميع أنواع مهام YOLO الخمسة:

المهمةالوصفأداة التوسيم
الكشفاكتشاف الكائنات باستخدام الصناديق المحيطةأداة المستطيل
تجزئةتجزئة الكائنات باستخدام أقنعة البكسلأداة المضلع
الوضعتقدير النقاط الرئيسية باستخدام قوالب الهياكل العظمية المدمجة والمخصصةأداة النقطة الرئيسية
OBBالصناديق المحيطة الموجهة للكائنات المدورةأداة الصندوق الموجه
تصنيفتصنيف على مستوى الصورةمحدد الفئة

اختيار نوع المهمة

يتم تعيين نوع المهمة عند إنشاء مجموعة البيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييره لاحقًا من إعدادات مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.

الميزات الرئيسية

التخزين الذكي

تستخدم Ultralytics التخزين القابل للعنونة بالمحتوى (CAS) لإدارة البيانات بكفاءة:

  • إزالة التكرار (Deduplication): يتم تخزين الصور المتطابقة مرة واحدة فقط عبر تجزئة XXH3-128
  • السلامة: العنونة المستندة إلى التجزئة تضمن سلامة البيانات
  • الكفاءة: تخزين محسن ومعالجة سريعة

معرفات URI لمجموعات البيانات

مجموعات البيانات المرجعية باستخدام ul:// تنسيق URI (انظر استخدام مجموعات بيانات المنصة):

yolo train data=ul://username/datasets/my-dataset

وهذا يتيح التدريب على مجموعات بيانات المنصة من أي جهاز تم تكوين مفتاح API الخاص بك عليه.

استخدام بيانات المنصة من Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

إدارة إصدارات مجموعات البيانات

أنشئ لقطات NDJSON غير قابلة للتغيير لمجموعة بياناتك للتدريب القابل للتكرار. يلتقط كل إصدار عدد الصور وعدد الفئات وعدد التعليقات التوضيحية وقت الإنشاء. انظر علامة تبويب الإصدارات للحصول على التفاصيل.

علامات تبويب مجموعة البيانات

تحتوي كل صفحة من صفحات مجموعة البيانات على ست علامات تبويب:

علامة التبويبالوصف
الصورتصفح الصور في عرض شبكي أو مضغوط أو جدولي مع تراكبات التعليقات التوضيحية
الفئاتعرض وتحرير أسماء الفئات والألوان وعدد الملصقات لكل فئة
الرسوم البيانيةإحصائيات تلقائية: توزيع التقسيم، عدد الفئات، خرائط الحرارة
النماذجالنماذج المدربة على مجموعة البيانات هذه مع المقاييس والحالة
الإصداراتأنشئ ونزّل لقطات NDJSON غير قابلة للتغيير للتدريب القابل للتكرار
الأخطاءالصور التي فشلت معالجتها مع تفاصيل الخطأ وإرشادات الإصلاح

الإحصائيات والتصور

في Charts توفر علامة التبويب تحليلاً تلقائياً يشمل:

  • توزيع الانقسام: مخطط دائري لعدد صور التدريب/التحقق/الاختبار
  • الفئات الأكثر شيوعًا: مخطط حلقي لفئات التعليقات التوضيحية الأكثر تكرارًا
  • عروض الصور: مدرج تكراري لتوزيع عروض الصور.
  • ارتفاعات الصور: مدرج تكراري لتوزيع ارتفاعات الصور.
  • النقاط لكل مثيل: توزيع عدد رؤوس المضلع أو النقاط الرئيسية (مجموعات بيانات segment/pose)
  • مواقع الوسوم: خريطة حرارية ثنائية الأبعاد لمواقع مراكز صناديق الإحاطة.
  • أبعاد الصورة: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط إرشادية لنسبة العرض إلى الارتفاع.

الأسئلة الشائعة

ما هي تنسيقات الملفات المدعومة للتحميل؟

تدعم منصة Ultralytics ما يلي:

الصور: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (بحد أقصى 50 ميجابايت لكل منها)

مقاطع الفيديو: MP4، WebM، MOV، AVI، MKV، M4V (بحد أقصى 1 جيجابايت، إطارات مستخرجة بمعدل 1 إطار في الثانية، بحد أقصى 100 إطار)

ملفات مجموعة البيانات: أرشيفات ZIP أو TAR تتضمن .tar.gz و .tgz (بحد أقصى 10 جيجابايت على المجاني، 20 جيجابايت على الاحترافي، 50 جيجابايت على المؤسسي) يحتوي على صور مع خيارات تسميات YOLO، بالإضافة إلى تصديرات NDJSON

ما هو الحد الأقصى لحجم مجموعة البيانات؟

تعتمد حدود التخزين على خطتك:

الخطةحد التخزين
مجاني100 جيجابايت
احترافي500 جيجابايت
المؤسساتغير محدود

حدود حجم الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، مجموعات البيانات 10 جيجابايت في الإصدار المجاني / 20 جيجابايت في الإصدار Pro / 50 جيجابايت في الإصدار Enterprise

هل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟

نعم! استخدم تنسيق URI لمجموعة البيانات للتدريب محليًا:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

أو قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للتدريب دون اتصال بالإنترنت تمامًا.



📅 تم الإنشاء قبل 2 أشهر ✏️ تم التحديث قبل 4 أيام
glenn-jocherRizwanMunawaramanharshxsergiuwaxmann

تعليقات