انتقل إلى المحتوى

نظرة عامة على مجموعات بيانات تصنيف الصور

تنسيق مجموعة البيانات

عادة ما تتبع بنية المجلد لمجموعات بيانات التصنيف في torchvision تنسيقا قياسيا:

root/
|-- class1/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class2/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class3/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- ...

في بنية المجلد هذه، root يحتوي الدليل على دليل فرعي واحد لكل فئة في مجموعة البيانات. تتم تسمية كل دليل فرعي بعد الفئة المقابلة ويحتوي على جميع الصور لتلك الفئة. تتم تسمية كل ملف صورة بشكل فريد وعادة ما يكون بتنسيق ملف صورة شائع مثل JPEG أو PNG.

**مثل**

على سبيل المثال ، في مجموعة بيانات CIFAR10 ، ستبدو بنية المجلد كما يلي:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...

في هذا المثال، train يحتوي الدليل على أدلة فرعية لكل فئة في مجموعة البيانات ، ويحتوي كل دليل فرعي للفئة على جميع الصور الخاصة بهذه الفئة. ال test الدليل لديه بنية مماثلة. ال root يحتوي الدليل أيضا على ملفات أخرى تشكل جزءا من مجموعة بيانات CIFAR10.

استخدام

مثل

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='path/to/dataset', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

مجموعات البيانات المدعومة

Ultralytics يدعم مجموعات البيانات التالية مع التنزيل التلقائي:

  • Caltech 101: مجموعة بيانات تحتوي على صور ل 101 فئة كائن لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديا.
  • CIFAR-10: مجموعة بيانات من 60K 32x32 صورة ملونة في 10 فئات ، مع 6K صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70000 صورة بتدرج الرمادي ل 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتصنيف الصور مع أكثر من 14 مليون صورة و 20000 فئة.
  • ImageNet-10: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
  • Imagenette: مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يمكن تمييزها بسهولة للتدريب والاختبار بشكل أسرع.
  • Imagewoof: مجموعة فرعية أكثر تحديا من ImageNet تحتوي على 10 فئات من سلالات لمهام تصنيف الصور.
  • MNIST: مجموعة بيانات من 70000 صورة بتدرج الرمادي للأرقام المكتوبة بخط اليد لمهام تصنيف الصور.

إضافة مجموعة البيانات الخاصة بك

إذا كان لديك مجموعة بيانات خاصة بك وترغب في استخدامها لنماذج تصنيف التدريب مع Ultralytics، وتأكد من أنه يتبع التنسيق المحدد أعلاه ضمن "تنسيق مجموعة البيانات" ثم أشر إلى data وسيطة إلى دليل مجموعة البيانات.



تم النشر في 2023-11-12, اخر تحديث 2024-01-07
المؤلفون: جلين جوشر (4) ، GreatV (1)

التعليقات