إعداد البيانات
يُعد إعداد البيانات أساس نجاح نماذج رؤية الكمبيوتر. توفر منصة Ultralytics أدوات شاملة لإدارة بيانات التدريب الخاصة بك، بدءًا من التحميل ومرورًا بالتعليقات التوضيحية وصولاً إلى التحليل.
شاهد: ابدأ مع Ultralytics - البيانات
نظرة عامة
يساعدك قسم البيانات في منصة Ultralytics على:
- تحميل الصور ومقاطع الفيديو وملفات مجموعات البيانات (بصيغة ZIP وTAR بما في ذلك
.tar.gz/.tgz، NDJSON) - وسم باستخدام أدوات الرسم اليدوية والوسم الذكي المدعوم بتقنية SAM — اختر من بين SAM 2.1 أو SAM 3 الجديد.
- تحليل بياناتك باستخدام الإحصائيات والتصورات
- تصدير بتنسيق NDJSON للتدريب المحلي.

سير العمل
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| المرحلة | الوصف |
|---|---|
| تحميل | استيراد الصور أو مقاطع الفيديو أو الأرشيفات مع المعالجة التلقائية |
| التعليق التوضيحي | قم بتسمية البيانات باستخدام أدوات يدوية لجميع أنواع المهام الخمسة، أو استخدم SAM detect segment و OBB. |
| تحليل | عرض توزيعات الفئات، وخرائط الحرارة المكانية، وإحصائيات الأبعاد |
| تصدير | تنزيل بتنسيق NDJSON للاستخدام دون اتصال بالإنترنت |
المهام المدعومة
تدعم منصة Ultralytics جميع أنواع مهام YOLO الخمسة:
| المهمة | الوصف | أداة التوسيم |
|---|---|---|
| الكشف | اكتشاف الكائنات باستخدام الصناديق المحيطة | أداة المستطيل |
| تجزئة | تجزئة الكائنات باستخدام أقنعة البكسل | أداة المضلع |
| الوضع | تقدير النقاط الرئيسية باستخدام قوالب الهياكل العظمية المدمجة والمخصصة | أداة النقطة الرئيسية |
| OBB | الصناديق المحيطة الموجهة للكائنات المدورة | أداة الصندوق الموجه |
| تصنيف | تصنيف على مستوى الصورة | محدد الفئة |
اختيار نوع المهمة
يتم تعيين نوع المهمة عند إنشاء مجموعة البيانات ويحدد أدوات التعليق التوضيحي المتاحة. يمكنك تغييره لاحقًا من إعدادات مجموعة البيانات، ولكن لن يتم عرض التعليقات التوضيحية غير المتوافقة بعد التبديل.
الميزات الرئيسية
التخزين الذكي
تستخدم Ultralytics التخزين القابل للعنونة بالمحتوى (CAS) لإدارة البيانات بكفاءة:
- إزالة التكرار (Deduplication): يتم تخزين الصور المتطابقة مرة واحدة فقط عبر تجزئة XXH3-128
- السلامة: العنونة المستندة إلى التجزئة تضمن سلامة البيانات
- الكفاءة: تخزين محسن ومعالجة سريعة
معرفات URI لمجموعات البيانات
مجموعات البيانات المرجعية باستخدام ul:// تنسيق URI (انظر استخدام مجموعات بيانات المنصة):
yolo train data=ul://username/datasets/my-dataset
وهذا يتيح التدريب على مجموعات بيانات المنصة من أي جهاز تم تكوين مفتاح API الخاص بك عليه.
استخدام بيانات المنصة من Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
إدارة إصدارات مجموعات البيانات
أنشئ لقطات NDJSON غير قابلة للتغيير لمجموعة بياناتك للتدريب القابل للتكرار. يلتقط كل إصدار عدد الصور وعدد الفئات وعدد التعليقات التوضيحية وقت الإنشاء. انظر علامة تبويب الإصدارات للحصول على التفاصيل.
علامات تبويب مجموعة البيانات
تحتوي كل صفحة من صفحات مجموعة البيانات على ست علامات تبويب:
| علامة التبويب | الوصف |
|---|---|
| الصور | تصفح الصور في عرض شبكي أو مضغوط أو جدولي مع تراكبات التعليقات التوضيحية |
| الفئات | عرض وتحرير أسماء الفئات والألوان وعدد الملصقات لكل فئة |
| الرسوم البيانية | إحصائيات تلقائية: توزيع التقسيم، عدد الفئات، خرائط الحرارة |
| النماذج | النماذج المدربة على مجموعة البيانات هذه مع المقاييس والحالة |
| الإصدارات | أنشئ ونزّل لقطات NDJSON غير قابلة للتغيير للتدريب القابل للتكرار |
| الأخطاء | الصور التي فشلت معالجتها مع تفاصيل الخطأ وإرشادات الإصلاح |
الإحصائيات والتصور
في Charts توفر علامة التبويب تحليلاً تلقائياً يشمل:
- توزيع الانقسام: مخطط دائري لعدد صور التدريب/التحقق/الاختبار
- الفئات الأكثر شيوعًا: مخطط حلقي لفئات التعليقات التوضيحية الأكثر تكرارًا
- عروض الصور: مدرج تكراري لتوزيع عروض الصور.
- ارتفاعات الصور: مدرج تكراري لتوزيع ارتفاعات الصور.
- النقاط لكل مثيل: توزيع عدد رؤوس المضلع أو النقاط الرئيسية (مجموعات بيانات segment/pose)
- مواقع الوسوم: خريطة حرارية ثنائية الأبعاد لمواقع مراكز صناديق الإحاطة.
- أبعاد الصورة: خريطة حرارية ثنائية الأبعاد للعرض مقابل الارتفاع مع خطوط إرشادية لنسبة العرض إلى الارتفاع.
روابط سريعة
- مجموعات البيانات: تحميل وإدارة وتصدير بيانات التدريب الخاصة بك
- التعليق التوضيحي: تصنيف البيانات باستخدام أدوات يدوية ومدعومة بالذكاء الاصطناعي
- التدريب السحابي: تدريب النماذج على مجموعات البيانات المشروحة الخاصة بك
- URI مجموعة البيانات: استخدم
ul://عناوين URI للتدريب من أي مكان
الأسئلة الشائعة
ما هي تنسيقات الملفات المدعومة للتحميل؟
تدعم منصة Ultralytics ما يلي:
الصور: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (بحد أقصى 50 ميجابايت لكل منها)
مقاطع الفيديو: MP4، WebM، MOV، AVI، MKV، M4V (بحد أقصى 1 جيجابايت، إطارات مستخرجة بمعدل 1 إطار في الثانية، بحد أقصى 100 إطار)
ملفات مجموعة البيانات: أرشيفات ZIP أو TAR تتضمن .tar.gz و .tgz (بحد أقصى 10 جيجابايت على المجاني، 20 جيجابايت على الاحترافي، 50 جيجابايت على المؤسسي) يحتوي على صور مع خيارات تسميات YOLO، بالإضافة إلى تصديرات NDJSON
ما هو الحد الأقصى لحجم مجموعة البيانات؟
تعتمد حدود التخزين على خطتك:
| الخطة | حد التخزين |
|---|---|
| مجاني | 100 جيجابايت |
| احترافي | 500 جيجابايت |
| المؤسسات | غير محدود |
حدود حجم الملفات الفردية: الصور 50 ميجابايت، مقاطع الفيديو 1 جيجابايت، مجموعات البيانات 10 جيجابايت في الإصدار المجاني / 20 جيجابايت في الإصدار Pro / 50 جيجابايت في الإصدار Enterprise
هل يمكنني استخدام مجموعات بيانات المنصة الخاصة بي للتدريب المحلي؟
نعم! استخدم تنسيق URI لمجموعة البيانات للتدريب محليًا:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
أو قم بتصدير مجموعة البيانات الخاصة بك بتنسيق NDJSON للتدريب دون اتصال بالإنترنت تمامًا.