إعداد البيانات
يُعد إعداد البيانات حجر الأساس لنجاح نماذج الرؤية الحاسوبية. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءاً من الرفع ومروراً بالتعليق التوضيحي (annotation) ووصولاً إلى التحليل.
Watch: Get Started with Ultralytics Platform - Data
نظرة عامة
يساعدك قسم البيانات في منصة Ultralytics على:
- رفع الصور ومقاطع الفيديو وملفات مجموعات البيانات (ZIP و TAR بما في ذلك
.tar.gz/.tgzو NDJSON) - التعليق التوضيحي باستخدام أدوات الرسم اليدوي والتوسيم الذكي المدعوم بـ SAM - اختر بين SAM 2.1 أو الإصدار الجديد SAM 3
- تحليل بياناتك باستخدام الإحصائيات والتصورات
- تصدير البيانات بـ تنسيق NDJSON للتدريب المحلي

سير العمل
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| المرحلة | الوصف |
|---|---|
| التحميل | استيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية |
| التعليق التوضيحي | توسيم البيانات باستخدام الأدوات اليدوية لأنواع المهام الخمس، أو استخدام تعليق SAM التوضيحي للاكتشاف (detect) والتقسيم (segment) و OBB |
| تحليل | عرض توزيعات الفئات، والخرائط الحرارية المكانية، وإحصائيات الأبعاد |
| التصدير | تنزيل البيانات بـ تنسيق NDJSON للاستخدام دون اتصال بالإنترنت |
المهام المدعومة
تدعم منصة Ultralytics جميع أنواع مهام YOLO الخمس:
| المهمة | الوصف | أداة التعليق التوضيحي |
|---|---|---|
| الاكتشاف (Detect) | اكتشاف الكائنات باستخدام مربعات الإحاطة (BBox) | أداة المستطيل |
| التقسيم (Segment) | تقسيم الحالات (instance segmentation) باستخدام أقنعة البكسل | أداة المضلع |
| الوضعية (Pose) | تقدير النقاط الرئيسية مع قوالب الهيكل العظمي المدمجة والمخصصة | أداة النقاط الرئيسية |
| OBB | مربعات إحاطة موجهة للكائنات المستديرة | أداة الصندوق الموجه |
| التصنيف (Classify) | تصنيف على مستوى الصورة | محدد الفئات |
يتم تعيين نوع المهمة عند إنشاء مجموعة بيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييرها لاحقاً من محدد مهام رأس مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.
الميزات الرئيسية
التخزين الذكي
تستخدم منصة Ultralytics التخزين القائم على المحتوى (CAS) لإدارة فعالة للبيانات:
- إزالة التكرار: يتم تخزين الصور المتطابقة مرة واحدة فقط عبر تجزئة XXH3-128
- النزاهة: تضمن العنونة القائمة على التجزئة سلامة البيانات
- الكفاءة: تخزين محسّن ومعالجة سريعة
معرفات موارد (URIs) لمجموعة البيانات
يمكنك الإشارة إلى مجموعات البيانات باستخدام تنسيق URI ul:// (راجع استخدام مجموعات بيانات المنصة):
yolo train data=ul://username/datasets/my-datasetيسمح هذا بالتدريب على مجموعات بيانات المنصة من أي جهاز تم تكوين مفتاح API الخاص بك عليه.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)إصدارات مجموعات البيانات
أنشئ لقطات NDJSON غير قابلة للتغيير لمجموعة بياناتك من أجل تدريب قابل للتكرار. يلتقط كل إصدار أعداد الصور، وأعداد الفئات، وأعداد التعليقات التوضيحية في وقت الإنشاء. راجع علامة تبويب الإصدارات للحصول على التفاصيل.
علامات تبويب مجموعة البيانات
يمكن أن تعرض صفحات مجموعة البيانات ما يصل إلى ست علامات تبويب، اعتماداً على حالة مجموعة البيانات وأذوناتك:
| علامة التبويب | الوصف |
|---|---|
| الصور | تصفح الصور في عرض شبكي أو مدمج أو جدولي مع تراكبات التعليق التوضيحي |
| الفئات | عرض وتعديل أسماء الفئات، والألوان، وأعداد التسميات لكل فئة |
| المخططات | إحصائيات تلقائية: توزيع التقسيم، أعداد الفئات، الخرائط الحرارية |
| النماذج | النماذج المدربة على مجموعة البيانات هذه مع المقاييس والحالة |
| الإصدارات | إنشاء وتنزيل لقطات NDJSON غير قابلة للتغيير للتدريب القابل للتكرار |
| الأخطاء | الصور التي فشلت في المعالجة مع تفاصيل الخطأ وتوجيهات الإصلاح |
Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.
التجميع (Clustering)
استكشف مجموعة بياناتك كمخطط مبعثر ثنائي الأبعاد تفاعلي حيث تتقارب الصور المتشابهة بصرياً - وهو أمر مفيد لكشف المجموعات والتكرارات والقيم المتطرفة، ولتفحص كيفية توزيع التقسيمات أو الفئات عبر بياناتك. استخدم أداة lasso على منطقة من المخطط لتصفية المعرض لتلك الصور. راجع التجميع لمزيد من التفاصيل.
الإحصائيات والتصور
The Charts tab provides automatic analysis including:
- توزيع التقسيم: مخطط دائري لأعداد صور التدريب/التحقق/الاختبار
- أهم الفئات: مخطط دائري لفئات التعليق التوضيحي الأكثر تكراراً
- عرض الصور: رسم بياني لتوزيع عرض الصور
- ارتفاع الصور: رسم بياني لتوزيع ارتفاع الصور
- النقاط لكل حالة: توزيع عدد رؤوس المضلع أو النقاط الرئيسية (مجموعات بيانات التقسيم/الوضعية)
- مواقع التعليق التوضيحي: خريطة حرارية ثنائية الأبعاد لمواقع مراكز مربعات الإحاطة
- أبعاد الصورة: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط إرشاد لنسبة العرض إلى الارتفاع
روابط سريعة
- مجموعات البيانات: ارفع وأدر وصدر بيانات التدريب الخاصة بك
- التعليق التوضيحي: وسّم البيانات باستخدام أدوات يدوية ومدعومة بالذكاء الاصطناعي
- التدريب السحابي: درب النماذج على مجموعات بياناتك المعلقة
- معرف موارد مجموعة البيانات (Dataset URI): استخدم
ul://URIs للتدريب من أي مكان
الأسئلة الشائعة
ما هي تنسيقات الملفات المدعومة للرفع؟
تدعم منصة Ultralytics:
الصور: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (بحد أقصى 50 ميجابايت لكل منها)
مقاطع الفيديو: MP4, WebM, MOV, AVI, MKV, M4V (بحد أقصى 1 جيجابايت، يتم استخراج الإطارات بمعدل 1 FPS، وبحد أقصى 100 إطار)
ملفات مجموعات البيانات: أرشيفات ZIP أو TAR بما في ذلك .tar.gz و .tgz (بحد أقصى 10 جيجابايت في الإصدار المجاني، 20 جيجابايت في Pro، 50 جيجابايت في Enterprise) تحتوي على صور مع تسميات بتنسيق YOLO اختيارية، بالإضافة إلى تصديرات NDJSON
ما هو الحد الأقصى لحجم مجموعة البيانات؟
تعتمد حدود التخزين على خطتك:
| الخطة | حد التخزين |
|---|---|
| مجاني | 100 جيجابايت |
| Pro | 500 جيجابايت |
| Enterprise | غير محدود |
حدود الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، مجموعات البيانات 10 جيجابايت في الإصدار المجاني / 20 جيجابايت في Pro / 50 جيجابايت في Enterprise
هل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟
نعم! استخدم تنسيق URI الخاص بمجموعة البيانات للتدريب محلياً:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100أو قم بتصدير مجموعة بياناتك بـ تنسيق NDJSON للتدريب دون اتصال بالإنترنت تماماً.