انتقل إلى المحتوى

نظرة عامة على مجموعات البيانات

Ultralytics يوفر الدعم لمجموعات البيانات المختلفة لتسهيل مهام رؤية الكمبيوتر مثل الكشف وتجزئة المثيل وتقدير الوضع والتصنيف وتتبع الكائنات المتعددة. فيما يلي قائمة بأهم Ultralytics مجموعات البيانات ، متبوعة بملخص لكل مهمة من مهام رؤية الكمبيوتر ومجموعات البيانات المعنية.



شاهد: Ultralytics نظرة عامة على مجموعات البيانات

الجديد 🚀 Ultralytics مستكشف

قم بإنشاء تضمينات لمجموعة البيانات الخاصة بك ، وابحث عن صور مماثلة ، وقم بتشغيل استعلامات SQL ، وقم بإجراء بحث دلالي وحتى البحث باستخدام اللغة الطبيعية! يمكنك البدء في استخدام تطبيق واجهة المستخدم الرسومية الخاص بنا أو إنشاء تطبيقك الخاص باستخدام واجهة برمجة التطبيقات. تعرف على المزيد هنا.

Ultralytics لقطة شاشة للمستكشف

كشف الكائن

اكتشاف كائن المربع المحيط هو تقنية رؤية الكمبيوتر التي تتضمن اكتشاف الكائنات وتوطينها في صورة عن طريق رسم مربع محيط حول كل كائن.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع التعليقات التوضيحية الغنية.
  • COCO: الكائنات الشائعة في السياق (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من الكائنات.
  • LVIS: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتقسيمها وشرحها مع 1203 فئة كائن.
  • COCO8: مجموعة فرعية أصغر من أول 4 صور من تدريب COCO وCOCO val، مناسبة للاختبارات السريعة.
  • القمح العالمي 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح للتحدي العالمي للقمح 2020.
  • Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق لاكتشاف الكائنات مع 365 فئة كائن وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة تدريب و42 ألف صورة تحقق من صحتها.
  • SKU-110K: مجموعة بيانات تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و 1.7 مليون مربع محيط.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • المركبات العضوية المتطايرة: مجموعة بيانات Pascal Visual Object Classes (VOC) لاكتشاف الكائنات وتجزئتها مع 20 فئة كائن وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لاكتشاف الكائنات في الصور العلوية مع 60 فئة كائن وأكثر من 1 مليون كائن مشروح.
  • Roboflow 100: معيار متنوع للكشف عن الكائنات مع 100 مجموعة بيانات تغطي سبعة مجالات صور لتقييم شامل للنموذج.
  • أورام الدماغ: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور التصوير بالرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل عن وجود الورم وموقعه وخصائصه.
  • الحياة البرية الأفريقية: مجموعة بيانات تضم صوراً للحياة البرية الأفريقية، بما في ذلك الجاموس، والفيل، ووحيد القرن، والحمير الوحشية.
  • التوقيع: مجموعة بيانات تضم صوراً لوثائق مختلفة مع توقيعات مشروحة، لدعم أبحاث التحقق من المستندات والكشف عن الاحتيال.

تجزئة المثيل

تجزئة المثيل هي تقنية رؤية الكمبيوتر التي تتضمن تحديد الكائنات وتوطينها في صورة على مستوى البكسل.

  • COCO: مجموعة بيانات واسعة النطاق مصممة لمهام اكتشاف الكائنات وتقسيمها وتسميتها مع أكثر من 200 ألف صورة مصنفة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثال ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للتجزئة.
  • Crack-seg: مجموعة بيانات مصممة خصيصا لاكتشاف الشقوق على الطرق والجدران ، قابلة للتطبيق لكل من مهام اكتشاف الكائنات والتجزئة.
  • Package-seg: مجموعة بيانات مخصصة لتحديد الحزم في المستودعات أو الإعدادات الصناعية ، ومناسبة لكل من تطبيقات اكتشاف الكائنات والتجزئة.
  • Carparts-seg: مجموعة بيانات مصممة خصيصا لتحديد قطع غيار المركبات ، وتلبية احتياجات التصميم والتصنيع والبحث. إنه يخدم كل من مهام اكتشاف الكائنات والتجزئة.

تقدير الوضع

تقدير الوضع هو تقنية تستخدم لتحديد وضع الكائن بالنسبة للكاميرا أو نظام إحداثيات العالم.

  • COCO: مجموعة بيانات واسعة النطاق مع تعليقات توضيحية بشرية مصممة لمهام تقدير الوضع.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضع ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للوضع البشري.
  • وضع النمر: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور ، مشروحة ب 12 نقطة رئيسية لكل نمر لمهام تقدير الوضع.

تصنيف

تصنيف الصور هو مهمة رؤية الكمبيوتر التي تتضمن تصنيف صورة إلى فئة أو فئات محددة مسبقا أو أكثر بناء على محتواها المرئي.

  • Caltech 101: مجموعة بيانات تحتوي على صور ل 101 فئة كائن لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديا.
  • CIFAR-10: مجموعة بيانات من 60K 32x32 صورة ملونة في 10 فئات ، مع 6K صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70000 صورة بتدرج الرمادي ل 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و 20000 فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر تحديا من ImageNet تحتوي على 10 فئات من سلالات لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات من 70000 صورة بتدرج الرمادي للأرقام المكتوبة بخط اليد لمهام تصنيف الصور.

المربعات المحيطة الموجهة (OBB)

المربعات المحيطة الموجهة (OBB) هي طريقة في رؤية الكمبيوتر لاكتشاف الكائنات الزاوية في الصور باستخدام المربعات المحيطة الدوارة ، وغالبا ما يتم تطبيقها على الصور الجوية والأقمار الصناعية.

  • DOTA-v2: مجموعة بيانات الصور الجوية الشهيرة OBB مع 1.7 مليون حالة و11,268 صورة.

تتبع الكائنات المتعددة

تتبع الكائنات المتعددة هو تقنية رؤية الكمبيوتر التي تنطوي على اكتشاف وتتبع كائنات متعددة بمرور الوقت في تسلسل الفيديو.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية لمهام تتبع الكائنات المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها بشكل جيد مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:

خطوات المساهمة بمجموعة بيانات جديدة

  1. جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة ، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
  2. التعليق على الصور: يمكنك إضافة تعليقات توضيحية إلى هذه الصور باستخدام المربعات المحيطة أو المقاطع أو النقاط الرئيسية، حسب المهمة.
  3. تصدير التعليقات التوضيحيةتحويل هذه التعليقات التوضيحية إلى ملف : YOLO *.txt تنسيق الملف الذي Ultralytics يدعم.
  4. تنظيم مجموعة البياناترتب مجموعة البيانات الخاصة بك في بنية المجلد الصحيحة.: يجب أن يكون لديك train/ و val/ أدلة المستوى الأعلى ، وداخل كل منها ، images/ و labels/ الفرعي.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. إنشاء ملف data.yaml ملففي الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاء ملف data.yaml الذي يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة ، فيمكنك تحسين الصور باستخدام الكود أدناه. هذا غير مطلوب ، ولكن يوصى به لأحجام مجموعات البيانات الأصغر وسرعات التنزيل الأسرع.
  7. مجموعة بيانات مضغوطة: ضغط مجلد مجموعة البيانات بالكامل في ملف مضغوط.
  8. المستند والعلاقات العامة: أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيف تتناسب مع إطار العمل الحالي. بعد ذلك ، أرسل طلب سحب (PR). الرجوع إلى Ultralytics إرشادات المساهمة لمزيد من التفاصيل حول كيفية تقديم العلاقات العامة.

مثال على التعليمات البرمجية لتحسين مجموعة بيانات وضغطها

تحسين مجموعة بيانات وضغطها

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

باتباع هذه الخطوات ، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل جيدا مع Ultralyticsالهيكل الحالي.

الأسئلة المتداولة

ما هي مجموعات البيانات التي يدعمها Ultralytics لاكتشاف الأجسام؟

Ultralytics يدعم مجموعة واسعة من مجموعات البيانات لاكتشاف الأجسام، بما في ذلك: - COCO: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من فئات الكائنات. - LVIS: مجموعة بيانات واسعة النطاق تحتوي على 1203 فئة من الكائنات، مصممة لاكتشاف الكائنات وتجزئتها بشكل أكثر دقة. - Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد وبيانات تنبؤات الحركة من البيئات الحضرية مع شروح غنية. - VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وبيانات تتبع الأجسام المتعددة من الصور الملتقطة بطائرة بدون طيار. - SKU-110K: تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهّل مجموعات البيانات هذه تدريب نماذج قوية لتطبيقات اكتشاف الأجسام المختلفة.

كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics ؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات: 1. جمع الصور: جمع الصور من قواعد البيانات العامة أو المجموعات الشخصية. 2. تعليق توضيحي للصور: تطبيق المربعات المحدودة، أو المقاطع، أو النقاط الرئيسية، حسب المهمة. 3. تصدير التعليقات التوضيحية: تحويل التعليقات التوضيحية إلى YOLO *.txt التنسيق. 4. تنظيم مجموعة البيانات: استخدم بنية المجلد مع train/ و val/ دلائل، يحتوي كل منها على images/ و labels/ دلائل فرعية. 5. إنشاء ملف data.yaml ملف: تضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة. 6. تحسين الصور (اختياري): تقليل حجم مجموعة البيانات لتحقيق الكفاءة. 7. مجموعة بيانات الرمز البريدي: ضغط مجموعة البيانات في ملف مضغوط. 8. الوثائق والعلاقات العامة: صف مجموعة البيانات الخاصة بك وأرسل طلب سحب بعد ذلك Ultralytics إرشادات المساهمة.

قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب أن أستخدم Ultralytics إكسبلورر لمجموعة البيانات الخاصة بي؟

Ultralytics يوفر Explorer ميزات قوية لتحليل مجموعة البيانات، بما في ذلك: - توليد التضمينات: إنشاء تضمينات متجهة للصور. - البحث الدلالي: البحث عن الصور المتشابهة باستخدام التضمينات أو الذكاء الاصطناعي. - استعلامات SQL: تشغيل استعلامات SQL متقدمة لتحليل البيانات التفصيلية. - بحث باللغة الطبيعية: البحث باستخدام استعلامات اللغة العادية لسهولة الاستخدام.

استكشف المستكشفUltralytics لمزيد من المعلومات ولتجربة العرض التوضيحي لواجهة المستخدم الرسومية.

ما هي الميزات الفريدة لنماذج Ultralytics YOLO للرؤية الحاسوبية؟

Ultralytics YOLO توفر النماذج العديد من الميزات الفريدة: - الأداء في الوقت الحقيقي: استدلال وتدريب عالي السرعة. - تعدد الاستخدامات: مناسبة لمهام الكشف والتجزئة والتصنيف وتقدير الوضعية. - نماذج مدربة مسبقًا: الوصول إلى النماذج عالية الأداء والمدربة مسبقًا لمختلف التطبيقات. - دعم مجتمعي واسع النطاق: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها وتطويرها.

اكتشف المزيد عن YOLO على Ultralytics YOLO الصفحة

كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics ؟

لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics ، اتبع هذا المثال البرمجي:

تحسين مجموعة بيانات وضغطها

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تعرف على المزيد حول كيفية تحسين مجموعة البيانات وضغطها.



تم الإنشاء 2023-11-12، تم التحديث 2024-07-04
المؤلفون: جلين-جوشيه (10)، رضوان منور (2)، برهان-ق (1)، الضاحك-ق (1)، أبيرامي-فينا (1)، أيوش إكسل (2)

التعليقات