انتقل إلى المحتوى

نظرة عامة على مجموعات بيانات الكشف عن الكائنات

يتطلب تدريب نموذج قوي ودقيق للكشف عن الكائنات مجموعة بيانات شاملة. يقدم هذا الدليل تنسيقات مختلفة من مجموعات البيانات المتوافقة مع Ultralytics YOLO نموذج ويوفر رؤى حول هيكلها واستخدامها وكيفية التحويل بين التنسيقات المختلفة.

تنسيقات مجموعات البيانات المدعومة

Ultralytics YOLO تنسيق

ال Ultralytics YOLO التنسيق هو تنسيق تكوين مجموعة بيانات يسمح لك بتحديد الدليل الجذر لمجموعة البيانات أو المسارات النسبية لأدلة صور التدريب / التحقق من الصحة / الاختبار أو *.txt الملفات التي تحتوي على مسارات الصور وقاموس أسماء الفئات. هنا مثال:

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8  # dataset root dir
train: images/train  # train images (relative to 'path') 4 images
val: images/val  # val images (relative to 'path') 4 images
test:  # test images (optional)

# Classes (80 COCO classes)
names:
  0: person
  1: bicycle
  2: car
  # ...
  77: teddy bear
  78: hair drier
  79: toothbrush

يجب تصدير التسميات لهذا التنسيق إلى YOLO تنسيق مع واحد *.txt ملف لكل صورة. إذا لم تكن هناك كائنات في صورة ، فلا *.txt الملف مطلوب. ال *.txt يجب تنسيق الملف بصف واحد لكل كائن في class x_center y_center width height تنسيق. يجب أن تكون إحداثيات المربع في تطبيع xywh التنسيق (من 0 إلى 1). إذا كانت المربعات الخاصة بك بالبكسل ، فيجب عليك التقسيم x_center و width حسب عرض الصورة، و y_center و height حسب ارتفاع الصورة. يجب أن تكون أرقام الفئات مفهرسة صفريا (ابدأ ب 0).

مثال على الصورة المسماة

يحتوي ملف التسمية المقابل للصورة أعلاه على 2 أشخاص (فئة 0) وربطة عنق (فئة 27):

مثال على ملف التسمية

عند استخدام Ultralytics YOLO قم بتنسيق وتنظيم صور وتسميات التدريب والتحقق من الصحة كما هو موضح في مثال مجموعة بيانات COCO8 أدناه.

مثال على بنية دليل مجموعة البيانات

استخدام

إليك كيفية استخدام هذه التنسيقات لتدريب نموذجك:

مثل

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='coco8.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco8.yaml model=yolov8n.pt epochs=100 imgsz=640

مجموعات البيانات المدعومة

فيما يلي قائمة بمجموعات البيانات المدعومة ووصف موجز لكل منها:

  • Argoverse: مجموعة من بيانات أجهزة الاستشعار التي تم جمعها من المركبات ذاتية القيادة. أنه يحتوي على التعليقات التوضيحية تتبع 3D لكائنات السيارة.
  • COCO: الكائنات الشائعة في السياق (COCO) عبارة عن مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتقسيمها وشرحها مع 80 فئة كائن.
  • LVIS: LVIS عبارة عن مجموعة بيانات واسعة النطاق للكشف عن الكائنات وتقسيمها وشرحها مع 1203 فئة كائن.
  • COCO8: مجموعة فرعية أصغر من مجموعة بيانات COCO ، COCO8 أكثر خفة وزنا وأسرع في التدريب.
  • GlobalWheat2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لتحدي القمح العالمي 2020.
  • Objects365: مجموعة بيانات واسعة النطاق للكشف عن الكائنات تحتوي على 365 فئة كائن و 600 ألف صورة ، تهدف إلى تطوير أبحاث اكتشاف الكائنات.
  • OpenImagesV7: مجموعة بيانات شاملة من Google تحتوي على 1.7 مليون صورة قطار و 42 ألف صورة تحقق.
  • SKU-110K: مجموعة بيانات تحتوي على صور لمنتجات البيع بالتجزئة المعبأة بكثافة، ومخصصة لاكتشاف كائنات بيئة البيع بالتجزئة.
  • VisDrone: مجموعة بيانات تركز على الصور المستندة إلى الطائرات بدون طيار ، وتحتوي على فئات كائنات مختلفة مثل السيارات والمشاة وراكبي الدراجات.
  • المركبات العضوية المتطايرة: PASCAL VOC هي مجموعة بيانات شائعة للكشف عن الكائنات مع 20 فئة من الكائنات بما في ذلك المركبات والأثاث.
  • xView: مجموعة بيانات تحتوي على صور قمر صناعي عالية الدقة ، مصممة لاكتشاف فئات الكائنات المختلفة في طرق العرض العلوية.
  • ورم الدماغ: تشتمل مجموعة البيانات هذه على صور التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب التي تحتوي على معلومات حول وجود ورم الدماغ وموقعه وخصائصه. يلعب دورا حاسما في تدريب نماذج الرؤية الحاسوبية لأتمتة تحديد الورم ، وتسهيل التشخيص المبكر وتخطيط العلاج.
  • الحياة البرية الأفريقية: تتميز مجموعة البيانات هذه بصور للحياة البرية الأفريقية مثل الجاموس ووحيد القرن والحمار الوحشي ، وهي مفيدة في تدريب نماذج رؤية الكمبيوتر. لا غنى عنه لتحديد عبر الموائل المختلفة ويساهم بشكل كبير في مساعي أبحاث الحياة البرية.

إضافة مجموعة البيانات الخاصة بك

إذا كان لديك مجموعة البيانات الخاصة بك وترغب في استخدامها لتدريب نماذج الكشف مع Ultralytics YOLO ، تأكد من أنه يتبع التنسيق المحدد أعلاه ضمن "Ultralytics YOLO شكل". قم بتحويل التعليقات التوضيحية إلى التنسيق المطلوب وحدد المسارات وعدد الفئات وأسماء الفئات في ملف تكوين YAML.

نقل أو تحويل تنسيقات الملصقات

تنسيق مجموعة بيانات COCO إلى YOLO تنسيق

يمكنك بسهولة تحويل التسميات من تنسيق مجموعة بيانات COCO الشهير إلى ملف YOLO التنسيق باستخدام مقتطف الشفرة التالي:

مثل

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir='path/to/coco/annotations/')

يمكن استخدام أداة التحويل هذه لتحويل مجموعة بيانات COCO أو أي مجموعة بيانات بتنسيق COCO إلى Ultralytics YOLO تنسيق.

تذكر أن تتحقق مرة أخرى مما إذا كانت مجموعة البيانات التي تريد استخدامها متوافقة مع النموذج الخاص بك وتتبع اصطلاحات التنسيق الضرورية. تعد مجموعات البيانات المنسقة بشكل صحيح أمرا بالغ الأهمية لتدريب نماذج اكتشاف الكائنات الناجحة.



تم النشر في 2023-11-12, اخر تحديث 2024-04-18
المؤلفون: جلين جوشر (7) ، IvorZhu331 (1) ، Laughing-q (1) ، رضوان منور (1)

التعليقات