مجموعة بيانات COCO8-Seg

مقدمة

تعد مجموعة Ultralytics COCO8-Seg مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ تجزئة المثيلات، وتتكون من أول 8 صور من مجموعة بيانات COCO train 2017، منها 4 للتدريب و4 للتحقق. تُعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج التجزئة، أو لتجربة أساليب اكتشاف جديدة. وبفضل احتوائها على 8 صور، فهي صغيرة بما يكفي لتكون قابلة للإدارة بسهولة، وفي نفس الوقت متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن الأخطاء والعمل كفحص أولي للسلامة قبل التدريب على مجموعات بيانات أكبر.

هيكل مجموعة البيانات

  • الصور: 8 صور إجمالاً (4 للتدريب / 4 للتحقق).
  • الفئات: 80 فئة من فئات COCO.
  • التصنيفات: مضلعات بتنسيق YOLO مخزنة تحت labels/{train,val} وتطابق كل ملف صورة.

تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.

ملف YAML الخاص بمجموعة البيانات

يتم استخدام ملف YAML (Yet Another Markup Language) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، ومعلومات أخرى ذات صلة. في حالة مجموعة بيانات COCO8-Seg، يتم الاحتفاظ بملف coco8-seg.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml.

ultralytics/cfg/datasets/coco8-seg.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-seg ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zip

الاستخدام

لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO8-Seg لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

صور وعينات تعليقات توضيحية

إليك بعض الأمثلة لصور من مجموعة بيانات COCO8-Seg، إلى جانب التصنيفات المقابلة لها:

COCO8-seg instance segmentation dataset mosaic
  • صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.

يُظهر المثال تنوع وتعقيد الصور في مجموعة بيانات COCO8-Seg وفوائد استخدام تقنية التجميع (mosaicing) أثناء عملية التدريب.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو عملك التطويري، فيرجى ذكر الورقة البحثية التالية:

اقتباس
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

نود أن نعرب عن تقديرنا لاتحاد COCO لإنشاء والحفاظ على هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات COCO ومنشئيها، تفضل بزيارة موقع مجموعة بيانات COCO.

الأسئلة الشائعة

ما هي مجموعة بيانات COCO8-Seg، وكيف تُستخدم في Ultralytics YOLO26؟

تُعد مجموعة بيانات COCO8-Seg مجموعة بيانات مدمجة لتجزئة المثيلات من Ultralytics، وتتكون من أول 8 صور من مجموعة COCO train 2017 - 4 صور للتدريب و4 للتحقق. تم تصميم مجموعة البيانات هذه خصيصاً لاختبار وتصحيح نماذج التجزئة أو تجربة أساليب اكتشاف جديدة. وهي مفيدة بشكل خاص مع Ultralytics YOLO26 وPlatform للتكرار السريع والتحقق من أخطاء خطوط الأنابيب قبل التوسع إلى مجموعات بيانات أكبر. للحصول على تفاصيل الاستخدام، راجع صفحة التدريب الخاصة بالنموذج.

كيف يمكنني تدريب نموذج YOLO26n-seg باستخدام مجموعة بيانات COCO8-Seg؟

لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO8-Seg لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام أوامر Python أو CLI. إليك مثال سريع:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # Load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

للحصول على شرح وافٍ للوسائط المتاحة وخيارات التكوين، يمكنك مراجعة وثائق التدريب.

لماذا تعد مجموعة بيانات COCO8-Seg مهمة لتطوير النماذج وتصحيح الأخطاء؟

توفر مجموعة بيانات COCO8-Seg مجموعة مدمجة ومتنوعة من 8 صور، مما يجعلها مثالية لاختبار وتصحيح نماذج التجزئة بسرعة أو تجربة تقنيات اكتشاف جديدة. يسمح حجمها الصغير بإجراء فحوصات سريعة للسلامة والتحقق المبكر من خطوط الأنابيب، مما يساعد في تحديد المشكلات قبل التوسع إلى مجموعات بيانات أكبر. تعرف على المزيد حول تنسيقات مجموعات البيانات المدعومة في دليل مجموعة بيانات التجزئة من Ultralytics.

أين يمكنني العثور على ملف تكوين YAML الخاص بمجموعة بيانات COCO8-Seg؟

ملف تكوين YAML الخاص بـ مجموعة بيانات COCO8-Seg متاح في مستودع Ultralytics. يمكنك الوصول إلى الملف مباشرة على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml. يتضمن ملف YAML معلومات أساسية حول مسارات مجموعة البيانات، والفئات، وإعدادات التكوين المطلوبة لتدريب النموذج والتحقق منه.

ما هي بعض فوائد استخدام تقنية التجميع (mosaicing) أثناء التدريب مع مجموعة بيانات COCO8-Seg؟

يساعد استخدام التجميع (mosaicing) أثناء التدريب في زيادة تنوع واختلاف الكائنات والمشاهد في كل دفعة تدريبية. تدمج هذه التقنية صوراً متعددة في صورة مركبة واحدة، مما يعزز قدرة النموذج على التعميم لمختلف أحجام الكائنات، ونسب العرض إلى الارتفاع، والسياقات داخل المشهد. يعد التجميع مفيداً لتحسين قوة النموذج والدقة، خاصة عند العمل مع مجموعات بيانات صغيرة مثل COCO8-Seg. للحصول على مثال للصور المجمعة، انظر قسم نماذج الصور والتصنيفات.

التعليقات