مجموعة بيانات COCO128-Seg
مقدمة
تُعد مجموعة بيانات Ultralytics COCO128-Seg مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ تجزئة المثيلات، وهي مكونة من أول 128 صورة من مجموعة COCO train 2017. تُعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج التجزئة، أو لتجربة أساليب اكتشاف جديدة. وبفضل احتوائها على 128 صورة، فهي صغيرة بما يكفي ليسهل التعامل معها، ومع ذلك فهي متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن أي أخطاء، والعمل كاختبار سلامة قبل التدريب على مجموعات بيانات أكبر.
هيكل مجموعة البيانات
- الصور: 128 صورة إجمالاً. يعيد ملف YAML الافتراضي استخدام نفس الدليل للتدريب والتحقق (train and val) حتى تتمكن من التكرار بسرعة، ولكن يمكنك تكرار التقسيم أو تخصيصه إذا رغبت في ذلك.
- الفئات: نفس فئات الكائنات الـ 80 الموجودة في COCO.
- الملصقات: مضلعات بتنسيق YOLO محفوظة بجانب كل صورة داخل
labels/{train,val}.
تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.
ملف YAML الخاص بمجموعة البيانات
يتم استخدام ملف YAML (لغة توصيف أخرى) لتحديد تكوين مجموعة البيانات. ويحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، وغيرها من المعلومات ذات الصلة. وفي حالة مجموعة بيانات COCO128-Seg، يتم الاحتفاظ بملف coco128-seg.yaml في الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO128-seg dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco/
# Example usage: yolo train data=coco128-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco128-seg ← downloads here (7 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128-seg # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128-seg.zipالاستخدام
لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO128-Seg لمدة 100 حقبة تدريب مع حجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)صور وعينات تعليقات توضيحية
فيما يلي بعض الأمثلة على الصور من مجموعة بيانات COCO128-Seg، بالإضافة إلى التعليقات التوضيحية المقابلة لها:
- صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.
يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات COCO128-Seg وفوائد استخدام التجميع (mosaicing) أثناء عملية التدريب.
الاقتباسات والشكر
إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو عملك التطويري، فيرجى ذكر الورقة البحثية التالية:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}نود أن نعرب عن تقديرنا لاتحاد COCO لإنشاء والحفاظ على هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات COCO ومنشئيها، تفضل بزيارة موقع مجموعة بيانات COCO.
الأسئلة الشائعة
ما هي مجموعة بيانات COCO128-Seg، وكيف يتم استخدامها في Ultralytics YOLO26؟
تعد مجموعة بيانات COCO128-Seg مجموعة بيانات مدمجة لتجزئة المثيلات من Ultralytics، وتتكون من أول 128 صورة من مجموعة COCO train 2017. تم تصميم مجموعة البيانات هذه لاختبار وتصحيح نماذج التجزئة أو تجربة طرق اكتشاف جديدة. وهي مفيدة بشكل خاص مع Ultralytics YOLO26 و Platform للتكرار السريع والتحقق من أخطاء خط الأنابيب قبل التوسع إلى مجموعات بيانات أكبر. للحصول على تفاصيل الاستخدام، راجع صفحة التدريب الخاصة بالنموذج.
كيف يمكنني تدريب نموذج YOLO26n-seg باستخدام مجموعة بيانات COCO128-Seg؟
لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO128-Seg لمدة 100 حقبة تدريب مع حجم صورة 640، يمكنك استخدام أوامر Python أو CLI. إليك مثال سريع:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # Load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)للحصول على شرح وافٍ للوسائط المتاحة وخيارات التكوين، يمكنك مراجعة وثائق التدريب.
لماذا تُعد مجموعة بيانات COCO128-Seg مهمة لتطوير النماذج وتصحيح أخطائها؟
توفر مجموعة بيانات COCO128-Seg مزيجاً متوازناً من سهولة الإدارة والتنوع بفضل احتوائها على 128 صورة، مما يجعلها مثالية لاختبار وتصحيح نماذج التجزئة بسرعة أو تجربة تقنيات اكتشاف جديدة. يسمح حجمها المتوسط بتكرارات تدريب سريعة مع توفير تنوع كافٍ للتحقق من خطوط أنابيب التدريب قبل التوسع إلى مجموعات بيانات أكبر. تعرف على المزيد حول تنسيقات مجموعات البيانات المدعومة في دليل مجموعة بيانات التجزئة الخاص بـ Ultralytics.
أين يمكنني العثور على ملف تكوين YAML الخاص بمجموعة بيانات COCO128-Seg؟
يتوفر ملف تكوين YAML الخاص بـ مجموعة بيانات COCO128-Seg في مستودع Ultralytics. يمكنك الوصول إلى الملف مباشرة على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml. يتضمن ملف YAML معلومات أساسية حول مسارات مجموعة البيانات، والفئات، وإعدادات التكوين المطلوبة لتدريب النموذج والتحقق من صحته.
ما هي بعض فوائد استخدام التجميع (mosaicing) أثناء التدريب باستخدام مجموعة بيانات COCO128-Seg؟
يساعد استخدام التجميع أثناء التدريب على زيادة تنوع وتعدد الكائنات والمشاهد في كل دفعة تدريب. تجمع هذه التقنية بين صور متعددة في صورة مركبة واحدة، مما يعزز قدرة النموذج على التعميم لمختلف أحجام الكائنات ونسب العرض إلى الارتفاع والسياقات داخل المشهد. التجميع مفيد لتحسين قوة النموذج والدقة، خاصة عند العمل مع مجموعات بيانات متوسطة الحجم مثل COCO128-Seg. للحصول على مثال للصور المجمعة، انظر قسم صور العينة والتعليقات التوضيحية.