مجموعة بيانات COCO8-Seg
مقدمة
تعد مجموعة Ultralytics COCO8-Seg مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ تجزئة المثيلات، وتتكون من أول 8 صور من مجموعة بيانات COCO train 2017، منها 4 للتدريب و4 للتحقق. تُعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج التجزئة، أو لتجربة أساليب اكتشاف جديدة. وبفضل احتوائها على 8 صور، فهي صغيرة بما يكفي لتكون قابلة للإدارة بسهولة، وفي نفس الوقت متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن الأخطاء والعمل كفحص أولي للسلامة قبل التدريب على مجموعات بيانات أكبر.
هيكل مجموعة البيانات
- الصور: 8 صور إجمالاً (4 للتدريب / 4 للتحقق).
- الفئات: 80 فئة من فئات COCO.
- التصنيفات: مضلعات بتنسيق YOLO مخزنة تحت
labels/{train,val}وتطابق كل ملف صورة.
تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.
ملف YAML الخاص بمجموعة البيانات
يتم استخدام ملف YAML (Yet Another Markup Language) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، ومعلومات أخرى ذات صلة. في حالة مجموعة بيانات COCO8-Seg، يتم الاحتفاظ بملف coco8-seg.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-seg ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zipالاستخدام
لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO8-Seg لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)صور وعينات تعليقات توضيحية
إليك بعض الأمثلة لصور من مجموعة بيانات COCO8-Seg، إلى جانب التصنيفات المقابلة لها:
- صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.
يُظهر المثال تنوع وتعقيد الصور في مجموعة بيانات COCO8-Seg وفوائد استخدام تقنية التجميع (mosaicing) أثناء عملية التدريب.
الاقتباسات والشكر
إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو عملك التطويري، فيرجى ذكر الورقة البحثية التالية:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}نود أن نعرب عن تقديرنا لاتحاد COCO لإنشاء والحفاظ على هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات COCO ومنشئيها، تفضل بزيارة موقع مجموعة بيانات COCO.
الأسئلة الشائعة
ما هي مجموعة بيانات COCO8-Seg، وكيف تُستخدم في Ultralytics YOLO26؟
تُعد مجموعة بيانات COCO8-Seg مجموعة بيانات مدمجة لتجزئة المثيلات من Ultralytics، وتتكون من أول 8 صور من مجموعة COCO train 2017 - 4 صور للتدريب و4 للتحقق. تم تصميم مجموعة البيانات هذه خصيصاً لاختبار وتصحيح نماذج التجزئة أو تجربة أساليب اكتشاف جديدة. وهي مفيدة بشكل خاص مع Ultralytics YOLO26 وPlatform للتكرار السريع والتحقق من أخطاء خطوط الأنابيب قبل التوسع إلى مجموعات بيانات أكبر. للحصول على تفاصيل الاستخدام، راجع صفحة التدريب الخاصة بالنموذج.
كيف يمكنني تدريب نموذج YOLO26n-seg باستخدام مجموعة بيانات COCO8-Seg؟
لتدريب نموذج YOLO26n-seg على مجموعة بيانات COCO8-Seg لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام أوامر Python أو CLI. إليك مثال سريع:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # Load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)للحصول على شرح وافٍ للوسائط المتاحة وخيارات التكوين، يمكنك مراجعة وثائق التدريب.
لماذا تعد مجموعة بيانات COCO8-Seg مهمة لتطوير النماذج وتصحيح الأخطاء؟
توفر مجموعة بيانات COCO8-Seg مجموعة مدمجة ومتنوعة من 8 صور، مما يجعلها مثالية لاختبار وتصحيح نماذج التجزئة بسرعة أو تجربة تقنيات اكتشاف جديدة. يسمح حجمها الصغير بإجراء فحوصات سريعة للسلامة والتحقق المبكر من خطوط الأنابيب، مما يساعد في تحديد المشكلات قبل التوسع إلى مجموعات بيانات أكبر. تعرف على المزيد حول تنسيقات مجموعات البيانات المدعومة في دليل مجموعة بيانات التجزئة من Ultralytics.
أين يمكنني العثور على ملف تكوين YAML الخاص بمجموعة بيانات COCO8-Seg؟
ملف تكوين YAML الخاص بـ مجموعة بيانات COCO8-Seg متاح في مستودع Ultralytics. يمكنك الوصول إلى الملف مباشرة على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml. يتضمن ملف YAML معلومات أساسية حول مسارات مجموعة البيانات، والفئات، وإعدادات التكوين المطلوبة لتدريب النموذج والتحقق منه.
ما هي بعض فوائد استخدام تقنية التجميع (mosaicing) أثناء التدريب مع مجموعة بيانات COCO8-Seg؟
يساعد استخدام التجميع (mosaicing) أثناء التدريب في زيادة تنوع واختلاف الكائنات والمشاهد في كل دفعة تدريبية. تدمج هذه التقنية صوراً متعددة في صورة مركبة واحدة، مما يعزز قدرة النموذج على التعميم لمختلف أحجام الكائنات، ونسب العرض إلى الارتفاع، والسياقات داخل المشهد. يعد التجميع مفيداً لتحسين قوة النموذج والدقة، خاصة عند العمل مع مجموعات بيانات صغيرة مثل COCO8-Seg. للحصول على مثال للصور المجمعة، انظر قسم نماذج الصور والتصنيفات.