مجموعة بيانات COCO128-Seg

مقدمة

تُعد مجموعة بيانات Ultralytics COCO128-Seg مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ تجزئة المثيلات، وهي مكونة من أول 128 صورة من مجموعة COCO train 2017. تُعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج التجزئة، أو لتجربة أساليب اكتشاف جديدة. وبفضل احتوائها على 128 صورة، فهي صغيرة بما يكفي ليسهل التعامل معها، ومع ذلك فهي متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن أي أخطاء، والعمل كاختبار سلامة قبل التدريب على مجموعات بيانات أكبر.

هيكل مجموعة البيانات

  • الصور: 128 صورة إجمالاً. يعيد ملف YAML الافتراضي استخدام نفس الدليل للتدريب والتحقق (train and val) حتى تتمكن من التكرار بسرعة، ولكن يمكنك تكرار التقسيم أو تخصيصه إذا رغبت في ذلك.
  • الفئات: نفس فئات الكائنات الـ 80 الموجودة في COCO.
  • الملصقات: مضلعات بتنسيق YOLO محفوظة بجانب كل صورة داخل labels/{train,val}.

تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.

ملف YAML الخاص بمجموعة البيانات

يتم استخدام ملف YAML (لغة توصيف أخرى) لتحديد تكوين مجموعة البيانات. ويحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، وغيرها من المعلومات ذات الصلة. وفي حالة مجموعة بيانات COCO128-Seg، يتم الاحتفاظ بملف coco128-seg.yaml في الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml.

ultralytics/cfg/datasets/coco128-seg.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO128-seg dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco/
# Example usage: yolo train data=coco128-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco128-seg ← downloads here (7 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128-seg # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128-seg.zip

الاستخدام

لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO128-Seg لمدة 100 حقبة تدريب مع حجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

صور وعينات تعليقات توضيحية

فيما يلي بعض الأمثلة على الصور من مجموعة بيانات COCO128-Seg، بالإضافة إلى التعليقات التوضيحية المقابلة لها:

COCO128-seg instance segmentation dataset mosaic
  • صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات COCO128-Seg وفوائد استخدام التجميع (mosaicing) أثناء عملية التدريب.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو عملك التطويري، فيرجى ذكر الورقة البحثية التالية:

اقتباس
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

نود أن نعرب عن تقديرنا لاتحاد COCO لإنشاء والحفاظ على هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات COCO ومنشئيها، تفضل بزيارة موقع مجموعة بيانات COCO.

الأسئلة الشائعة

ما هي مجموعة بيانات COCO128-Seg، وكيف يتم استخدامها في Ultralytics YOLO26؟

تعد مجموعة بيانات COCO128-Seg مجموعة بيانات مدمجة لتجزئة المثيلات من Ultralytics، وتتكون من أول 128 صورة من مجموعة COCO train 2017. تم تصميم مجموعة البيانات هذه لاختبار وتصحيح نماذج التجزئة أو تجربة طرق اكتشاف جديدة. وهي مفيدة بشكل خاص مع Ultralytics YOLO26 و Platform للتكرار السريع والتحقق من أخطاء خط الأنابيب قبل التوسع إلى مجموعات بيانات أكبر. للحصول على تفاصيل الاستخدام، راجع صفحة التدريب الخاصة بالنموذج.

كيف يمكنني تدريب نموذج YOLO26n-seg باستخدام مجموعة بيانات COCO128-Seg؟

لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO128-Seg لمدة 100 حقبة تدريب مع حجم صورة 640، يمكنك استخدام أوامر Python أو CLI. إليك مثال سريع:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # Load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

للحصول على شرح وافٍ للوسائط المتاحة وخيارات التكوين، يمكنك مراجعة وثائق التدريب.

لماذا تُعد مجموعة بيانات COCO128-Seg مهمة لتطوير النماذج وتصحيح أخطائها؟

توفر مجموعة بيانات COCO128-Seg مزيجاً متوازناً من سهولة الإدارة والتنوع بفضل احتوائها على 128 صورة، مما يجعلها مثالية لاختبار وتصحيح نماذج التجزئة بسرعة أو تجربة تقنيات اكتشاف جديدة. يسمح حجمها المتوسط بتكرارات تدريب سريعة مع توفير تنوع كافٍ للتحقق من خطوط أنابيب التدريب قبل التوسع إلى مجموعات بيانات أكبر. تعرف على المزيد حول تنسيقات مجموعات البيانات المدعومة في دليل مجموعة بيانات التجزئة الخاص بـ Ultralytics.

أين يمكنني العثور على ملف تكوين YAML الخاص بمجموعة بيانات COCO128-Seg؟

يتوفر ملف تكوين YAML الخاص بـ مجموعة بيانات COCO128-Seg في مستودع Ultralytics. يمكنك الوصول إلى الملف مباشرة على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml. يتضمن ملف YAML معلومات أساسية حول مسارات مجموعة البيانات، والفئات، وإعدادات التكوين المطلوبة لتدريب النموذج والتحقق من صحته.

ما هي بعض فوائد استخدام التجميع (mosaicing) أثناء التدريب باستخدام مجموعة بيانات COCO128-Seg؟

يساعد استخدام التجميع أثناء التدريب على زيادة تنوع وتعدد الكائنات والمشاهد في كل دفعة تدريب. تجمع هذه التقنية بين صور متعددة في صورة مركبة واحدة، مما يعزز قدرة النموذج على التعميم لمختلف أحجام الكائنات ونسب العرض إلى الارتفاع والسياقات داخل المشهد. التجميع مفيد لتحسين قوة النموذج والدقة، خاصة عند العمل مع مجموعات بيانات متوسطة الحجم مثل COCO128-Seg. للحصول على مثال للصور المجمعة، انظر قسم صور العينة والتعليقات التوضيحية.

التعليقات