Link to this sectionإعداد البيانات#
تعد معالجة البيانات أساساً لنماذج الرؤية الحاسوبية الناجحة. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءاً من الرفع ومروراً بالتعليق التوضيحي (annotation) وصولاً إلى التحليل.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionنظرة عامة#
يساعدك قسم البيانات في منصة Ultralytics على:
- رفع الصور ومقاطع الفيديو وملفات مجموعات البيانات (ZIP، وTAR بما في ذلك
.tar.gz/.tgz، وNDJSON) - التعليق التوضيحي (Annotate) باستخدام أدوات الرسم اليدوي والتوسيم الذكي المدعوم بـ SAM — اختر من بين SAM 2.1 أو الإصدار الجديد SAM 3
- تحليل بياناتك باستخدام الإحصائيات والتصورات
- تصدير البيانات بتنسيق NDJSON للتدريب المحلي

Link to this sectionسير العمل#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| المرحلة | الوصف |
|---|---|
| Upload | استيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية |
| التصنيف (Annotate) | وسم البيانات بأدوات يدوية لجميع أنواع المهام الست، أو استخدام خاصية التعليق التوضيحي SAM للكشف، والتجزئة، والتجزئة الدلالية، وOBB |
| تحليل | عرض توزيعات الفئات، والخرائط الحرارية المكانية، وإحصائيات الأبعاد |
| التصدير | التنزيل بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت |
Link to this sectionالمهام المدعومة#
تدعم منصة Ultralytics جميع أنواع مهام YOLO الستة:
| المهمة | الوصف | أداة التعليق التوضيحي |
|---|---|---|
| Detect | كشف الكائنات باستخدام صناديق التحديد (bounding boxes) | أداة المستطيل |
| Segment | تجزئة النماذج (Instance segmentation) باستخدام أقنعة البكسل | أداة المضلع |
| Semantic | التجزئة الدلالية (Semantic segmentation) باستخدام مناطق البكسل لكل فئة | أداة المضلع |
| Pose | تقدير النقاط الرئيسية (Keypoint estimation) مع قوالب هيكلية مدمجة ومخصصة | أداة النقاط الرئيسية |
| OBB | صناديق التحديد الموجهة (Oriented bounding boxes) للكائنات المستديرة | أداة الصندوق الموجه |
| Classify | تصنيف على مستوى الصورة | محدد الفئات |
يتم تعيين نوع المهمة عند إنشاء مجموعة بيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييرها لاحقاً من محدد مهام رأس مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.
Link to this sectionالميزات الرئيسية#
Link to this sectionالتخزين الذكي#
تستخدم منصة Ultralytics التخزين المعتمد على المحتوى (CAS) لإدارة فعالة للبيانات:
- إلغاء التكرار: يتم تخزين الصور المتطابقة مرة واحدة فقط عبر تجزئة XXH3-128
- النزاهة: تضمن العنونة القائمة على التجزئة سلامة البيانات
- الكفاءة: تخزين مُحسَّن ومعالجة سريعة
Link to this sectionمعرفات الموارد الموحدة (URI) لمجموعات البيانات#
مرجع مجموعات البيانات باستخدام تنسيق URI ul:// (راجع استخدام مجموعات بيانات المنصة):
yolo train data=ul://username/datasets/my-datasetيسمح هذا بالتدريب على مجموعات بيانات المنصة من أي جهاز تم إعداد مفتاح API الخاص بك عليه.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionإصدار مجموعات البيانات#
إنشاء لقطات NDJSON غير قابلة للتغيير لمجموعة البيانات الخاصة بك من أجل تدريب قابل للتكرار. يلتقط كل إصدار أعداد الصور، وأعداد الفئات، وأعداد التعليقات التوضيحية وقت الإنشاء. راجع علامة تبويب الإصدارات للحصول على التفاصيل.
Link to this sectionتبويبات مجموعة البيانات#
يمكن لصفحات مجموعة البيانات عرض ما يصل إلى ست علامات تبويب، اعتماداً على حالة مجموعة البيانات وأذوناتك:
| علامة التبويب | الوصف |
|---|---|
| الصور | تصفح الصور في عرض الشبكة، أو العرض المدمج، أو عرض الجدول مع تراكبات التعليقات التوضيحية |
| الفئات (Classes) | عرض وتحرير أسماء الفئات، والألوان، وعدد التسميات لكل فئة |
| المخططات | إحصائيات تلقائية: توزيع الانقسام، وعدد الفئات، والخرائط الحرارية |
| النماذج | النماذج المدربة على مجموعة البيانات هذه مع المقاييس والحالة |
| الإصدارات | إنشاء وتنزيل لقطات NDJSON غير قابلة للتغيير من أجل تدريب قابل للتكرار |
| Errors | الصور التي فشلت معالجتها مع تفاصيل الخطأ وتوجيهات الإصلاح |
تظهر Classes و Charts عندما يحتوي مجموعة البيانات على صور. تظهر Errors فقط عند وجود إخفاقات في المعالجة. تظهر Versions للمالكين، أو لغير المالكين عند وجود إصدارات بالفعل.
Link to this sectionالتجميع (Clustering)#
استكشف مجموعة البيانات الخاصة بك كمخطط مبعثر ثنائي الأبعاد تفاعلي حيث توضع الصور المتشابهة بصرياً بالقرب من بعضها البعض — وهو أمر مفيد لكشف المجموعات (clusters)، والتكرارات، والقيم المتطرفة، ولتفحص كيفية توزيع الانقسامات أو الفئات عبر بياناتك. قم بتحديد منطقة من المخطط لتصفية المعرض لتلك الصور. راجع التجميع للحصول على التفاصيل.
Link to this sectionالإحصائيات والتصور#
توفر علامة التبويب Charts تحليلاً تلقائياً يتضمن:
- توزيع الانقسام: مخطط حلقي لأعداد صور التدريب/التحقق/الاختبار
- أهم الفئات: مخطط حلقي لفئات التعليقات التوضيحية الأكثر تكراراً
- أبعاد الصورة: رسم بياني لتوزيع عرض وارتفاع الصورة (بالبكسل)
- النقاط لكل نموذج: توزيع عدد رؤوس المضلع أو النقاط الرئيسية (لمجموعات بيانات التجزئة/الوضع)
- مواقع التعليقات التوضيحية: خريطة حرارية ثنائية الأبعاد لمواقع مركز صندوق التحديد
- أبعاد الصورة ثنائية الأبعاد: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط دليل نسبة العرض إلى الارتفاع
Link to this sectionروابط سريعة#
- مجموعات البيانات: رفع وإدارة وتصدير بيانات التدريب الخاصة بك
- التعليق التوضيحي: وسم البيانات بأدوات يدوية ومدعومة بالذكاء الاصطناعي
- التدريب السحابي: تدريب النماذج على مجموعات البيانات التي قمت بتعليقها
- معرف مجموعة البيانات (Dataset URI): استخدم معرفات
ul://للتدريب من أي مكان
Link to this sectionالأسئلة الشائعة#
Link to this sectionما هي تنسيقات الملفات المدعومة للرفع؟#
تدعم منصة Ultralytics ما يلي:
الصور: JPEG، PNG، WebP، BMP، TIFF، HEIC، AVIF، JP2، DNG، MPO (بحد أقصى 50 ميجابايت لكل منها)
الفيديوهات: MP4، WebM، MOV، MKV، M4V (بحد أقصى 1 جيجابايت، يتم استخراج الإطارات بمعدل 1 FPS، وبحد أقصى 100 إطار)
ملفات مجموعات البيانات: أرشيفات ZIP أو TAR بما في ذلك .tar.gz و.tgz (بحد أقصى 10 جيجابايت على الخطة المجانية، 20 جيجابايت على Pro، و50 جيجابايت على Enterprise) تحتوي على صور مع تسميات بتنسيق YOLO اختيارية، بالإضافة إلى تصديرات NDJSON
Link to this sectionما هو الحد الأقصى لحجم مجموعة البيانات؟#
تعتمد حدود التخزين على خطتك:
| الخطة | حد التخزين |
|---|---|
| مجاني | 100 جيجابايت |
| Pro | 500 جيجابايت |
| Enterprise | غير محدود |
حدود الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، مجموعات البيانات 10 جيجابايت على الخطة المجانية / 20 جيجابايت على Pro / 50 جيجابايت على Enterprise
Link to this sectionهل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟#
نعم! استخدم تنسيق معرف مجموعة البيانات (dataset URI) للتدريب محلياً:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100أو قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للتدريب دون اتصال بالإنترنت تماماً.