انتقل إلى المحتوى

نظرة عامة على مجموعات البيانات

Ultralytics provides support for various datasets to facilitate computer vision tasks such as detection, instance segmentation, pose estimation, classification, and multi-object tracking. Below is a list of the main Ultralytics datasets, followed by a summary of each computer vision task and the respective datasets.



شاهد: Ultralytics نظرة عامة على مجموعات البيانات

Ultralytics مستكشف

مذكرة المجتمع ⚠️

اعتباراً من ultralytics>=8.3.10, Ultralytics explorer support has been deprecated. But don't worry! You can now access similar and even enhanced functionality through Ultralytics محور, our intuitive no-code platform designed to streamline your workflow. With Ultralytics HUB, you can continue exploring, visualizing, and managing your data effortlessly, all without writing a single line of code. Make sure to check it out and take advantage of its powerful features!🚀

Create embeddings for your dataset, search for similar images, run SQL queries, perform semantic search and even search using natural language! You can get started with our GUI app or build your own using the API. Learn more here.

Ultralytics لقطة شاشة للمستكشف

كشف الكائن

Bounding box object detection is a computer vision technique that involves detecting and localizing objects in an image by drawing a bounding box around each object.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع التعليقات التوضيحية الغنية.
  • COCO: الكائنات الشائعة في السياق (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتجزئتها وتسميتها مع 80 فئة من الكائنات.
  • LVIS: مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتقسيمها وشرحها مع 1203 فئة كائن.
  • COCO8: مجموعة فرعية أصغر من أول 4 صور من تدريب COCO وCOCO val، مناسبة للاختبارات السريعة.
  • COCO128: مجموعة فرعية أصغر من أول 128 صورة من أول 128 صورة من تدريب COCO وCOCO val، مناسبة للاختبارات.
  • القمح العالمي 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح للتحدي العالمي للقمح 2020.
  • Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق لاكتشاف الكائنات مع 365 فئة كائن وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة تدريب و42 ألف صورة تحقق من صحتها.
  • SKU-110K: مجموعة بيانات تتميز باكتشاف الأجسام الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و 1.7 مليون مربع محيط.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • المركبات العضوية المتطايرة: مجموعة بيانات Pascal Visual Object Classes (VOC) لاكتشاف الكائنات وتجزئتها مع 20 فئة كائن وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لاكتشاف الكائنات في الصور العلوية مع 60 فئة كائن وأكثر من 1 مليون كائن مشروح.
  • RF100: A diverse object detection benchmark with 100 datasets spanning seven imagery domains for comprehensive model evaluation.
  • أورام الدماغ: مجموعة بيانات للكشف عن أورام الدماغ تتضمن صور التصوير بالرنين المغناطيسي أو الأشعة المقطعية مع تفاصيل عن وجود الورم وموقعه وخصائصه.
  • الحياة البرية الأفريقية: مجموعة بيانات تضم صوراً للحياة البرية الأفريقية، بما في ذلك الجاموس، والفيل، ووحيد القرن، والحمير الوحشية.
  • التوقيع: مجموعة بيانات تضم صوراً لوثائق مختلفة مع توقيعات مشروحة، لدعم أبحاث التحقق من المستندات والكشف عن الاحتيال.

تجزئة المثيل

تجزئة المثيل هي تقنية رؤية الكمبيوتر التي تتضمن تحديد الكائنات وتوطينها في صورة على مستوى البكسل.

  • COCO: مجموعة بيانات واسعة النطاق مصممة لمهام اكتشاف الكائنات وتقسيمها وتسميتها مع أكثر من 200 ألف صورة مصنفة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثال ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للتجزئة.
  • COCO128-seg: A smaller dataset for instance segmentation tasks, containing a subset of 128 COCO images with segmentation annotations.
  • Crack-seg: مجموعة بيانات مصممة خصيصا لاكتشاف الشقوق على الطرق والجدران ، قابلة للتطبيق لكل من مهام اكتشاف الكائنات والتجزئة.
  • Package-seg: مجموعة بيانات مخصصة لتحديد الحزم في المستودعات أو الإعدادات الصناعية ، ومناسبة لكل من تطبيقات اكتشاف الكائنات والتجزئة.
  • Carparts-seg: مجموعة بيانات مصممة خصيصا لتحديد قطع غيار المركبات ، وتلبية احتياجات التصميم والتصنيع والبحث. إنه يخدم كل من مهام اكتشاف الكائنات والتجزئة.

تقدير الوضع

تقدير الوضع هو تقنية تستخدم لتحديد وضع الكائن بالنسبة للكاميرا أو نظام إحداثيات العالم.

  • COCO: مجموعة بيانات واسعة النطاق مع تعليقات توضيحية بشرية مصممة لمهام تقدير الوضع.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضع ، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للوضع البشري.
  • وضع النمر: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور ، مشروحة ب 12 نقطة رئيسية لكل نمر لمهام تقدير الوضع.
  • Hand-Keypoints: A concise dataset featuring over 26,000 images centered on human hands, annotated with 21 keypoints per hand, designed for pose estimation tasks.
  • Dog-pose: A comprehensive dataset featuring approximately 6,000 images focused on dogs, annotated with 24 keypoints per dog, tailored for pose estimation tasks.

تصنيف

Image classification is a computer vision task that involves categorizing an image into one or more predefined classes or categories based on its visual content.

  • Caltech 101: مجموعة بيانات تحتوي على صور ل 101 فئة كائن لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديا.
  • CIFAR-10: مجموعة بيانات من 60K 32x32 صورة ملونة في 10 فئات ، مع 6K صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70000 صورة بتدرج الرمادي ل 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و 20000 فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر تحديا من ImageNet تحتوي على 10 فئات من سلالات لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات من 70000 صورة بتدرج الرمادي للأرقام المكتوبة بخط اليد لمهام تصنيف الصور.
  • MNIST160: First 8 images of each MNIST category from the MNIST dataset. Dataset contains 160 images total.

المربعات المحيطة الموجهة (OBB)

المربعات المحيطة الموجهة (OBB) هي طريقة في رؤية الكمبيوتر لاكتشاف الكائنات الزاوية في الصور باستخدام المربعات المحيطة الدوارة ، وغالبا ما يتم تطبيقها على الصور الجوية والأقمار الصناعية.

  • DOTA-v2: مجموعة بيانات الصور الجوية الشهيرة OBB مع 1.7 مليون حالة و11,268 صورة.
  • DOTA8: A smaller subset of the first 8 images from the DOTAv1 split set, 4 for training and 4 for validation, suitable for quick tests.

تتبع الكائنات المتعددة

تتبع الكائنات المتعددة هو تقنية رؤية الكمبيوتر التي تنطوي على اكتشاف وتتبع كائنات متعددة بمرور الوقت في تسلسل الفيديو.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية لمهام تتبع الكائنات المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور التي تم التقاطها بواسطة طائرة بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها بشكل جيد مع البنية التحتية الحالية. فيما يلي الخطوات اللازمة:

خطوات المساهمة بمجموعة بيانات جديدة

  1. جمع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمعها من مصادر مختلفة ، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
  2. التعليق على الصور: يمكنك إضافة تعليقات توضيحية إلى هذه الصور باستخدام المربعات المحيطة أو المقاطع أو النقاط الرئيسية، حسب المهمة.
  3. تصدير التعليقات التوضيحيةتحويل هذه التعليقات التوضيحية إلى ملف : YOLO *.txt تنسيق الملف الذي Ultralytics يدعم.
  4. تنظيم مجموعة البياناترتب مجموعة البيانات الخاصة بك في بنية المجلد الصحيحة.: يجب أن يكون لديك train/ و val/ أدلة المستوى الأعلى ، وداخل كل منها ، images/ و labels/ الفرعي.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. إنشاء ملف data.yaml ملففي الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاء ملف data.yaml الذي يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة ، فيمكنك تحسين الصور باستخدام الكود أدناه. هذا غير مطلوب ، ولكن يوصى به لأحجام مجموعات البيانات الأصغر وسرعات التنزيل الأسرع.
  7. مجموعة بيانات مضغوطة: ضغط مجلد مجموعة البيانات بالكامل في ملف مضغوط.
  8. المستند والعلاقات العامة: أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيف تتناسب مع إطار العمل الحالي. بعد ذلك ، أرسل طلب سحب (PR). الرجوع إلى Ultralytics إرشادات المساهمة لمزيد من التفاصيل حول كيفية تقديم العلاقات العامة.

مثال على التعليمات البرمجية لتحسين مجموعة بيانات وضغطها

تحسين مجموعة بيانات وضغطها

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

باتباع هذه الخطوات ، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل جيدا مع Ultralyticsالهيكل الحالي.

الأسئلة المتداولة

What datasets does Ultralytics support for object detection?

Ultralytics يدعم مجموعة متنوعة من مجموعات البيانات للكشف عن الأجسام، بما في ذلك

  • COCO: A large-scale object detection, segmentation, and captioning dataset with 80 object categories.
  • LVIS: An extensive dataset with 1203 object categories, designed for more fine-grained object detection and segmentation.
  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع 3D والتنبؤ بالحركة من البيئات الحضرية مع التعليقات التوضيحية الغنية.
  • VisDrone: A dataset with object detection and multi-object tracking data from drone-captured imagery.
  • SKU-110K: Featuring dense object detection in retail environments with over 11K images.

تسهّل مجموعات البيانات هذه تدريب نماذج قوية لتطبيقات اكتشاف الأجسام المختلفة.

كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics ؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

  1. Collect Images: Gather images from public databases or personal collections.
  2. Annotate Images: Apply bounding boxes, segments, or keypoints, depending on the task.
  3. تصدير التعليقات التوضيحية: تحويل التعليقات التوضيحية إلى YOLO *.txt تنسيق.
  4. تنظيم مجموعة البيانات: استخدم بنية المجلد مع train/ و val/ دلائل، يحتوي كل منها على images/ و labels/ دلائل فرعية.
  5. إنشاء ملف data.yaml ملف: Include dataset descriptions, classes, and other relevant information.
  6. Optimize Images (Optional): Reduce dataset size for efficiency.
  7. Zip Dataset: Compress the dataset into a zip file.
  8. Document and PR: Describe your dataset and submit a Pull Request following Ultralytics Contribution Guidelines.

قم بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب أن أستخدم Ultralytics إكسبلورر لمجموعة البيانات الخاصة بي؟

Ultralytics يوفر Explorer ميزات قوية لتحليل مجموعة البيانات، بما في ذلك:

  • Embeddings Generation: Create vector embeddings for images.
  • Semantic Search: Search for similar images using embeddings or AI.
  • SQL Queries: Run advanced SQL queries for detailed data analysis.
  • Natural Language Search: Search using plain language queries for ease of use.

استكشف المستكشفUltralytics لمزيد من المعلومات ولتجربة العرض التوضيحي لواجهة المستخدم الرسومية.

What are the unique features of Ultralytics YOLO models for computer vision?

Ultralytics YOLO توفر النماذج العديد من الميزات الفريدة:

  • Real-time Performance: High-speed inference and training.
  • Versatility: Suitable for detection, segmentation, classification, and pose estimation tasks.
  • Pretrained Models: Access to high-performing, pretrained models for various applications.
  • Extensive Community Support: Active community and comprehensive documentation for troubleshooting and development.

اكتشف المزيد عن YOLO على Ultralytics YOLO الصفحة

كيف يمكنني تحسين وضغط مجموعة بيانات باستخدام أدوات Ultralytics ؟

لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics ، اتبع هذا المثال البرمجي:

تحسين مجموعة بيانات وضغطها

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تعرف على المزيد حول كيفية تحسين مجموعة البيانات وضغطها.

📅 Created 1 year ago ✏️ Updated 3 days ago

التعليقات