Link to this sectionمجموعة بيانات COCO128#
Link to this sectionمقدمة#
مجموعة بيانات Ultralytics COCO128 هي مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ كشف الأشياء تتكون من أول 128 صورة من مجموعة تدريب COCO لعام 2017. تعتبر مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج كشف الأشياء، أو لتجربة أساليب كشف جديدة. مع 128 صورة، فهي صغيرة بما يكفي لتكون سهلة الإدارة، ومع ذلك متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن الأخطاء والعمل كفحص سلامة قبل التدريب على مجموعات بيانات أكبر.
Watch: Ultralytics COCO Dataset Overview
مجموعة البيانات هذه مخصصة للاستخدام مع Ultralytics Platform و YOLO26.
Link to this sectionYAML مجموعة البيانات#
يتم استخدام ملف YAML (Yet Another Markup Language) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، وغيرها من المعلومات ذات الصلة. في حالة مجموعة بيانات COCO128، يتم الاحتفاظ بملف coco128.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO128 dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco128
# Example usage: yolo train data=coco128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco128 ← downloads here (7 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128 # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zipLink to this sectionالاستخدام#
لتدريب نموذج YOLO26n على مجموعة بيانات COCO128 لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)Link to this sectionصور وشروحات توضيحية عينة#
إليك بعض الأمثلة لصور من مجموعة بيانات COCO128، جنباً إلى جنب مع التعليقات التوضيحية المقابلة لها:
- صورة مجمعة (Mosaiced Image): توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات مجمعة. الفسيفساء (Mosaicing) هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع وسياقات مختلفة.
يوضح المثال تنوع وتعقيد الصور في مجموعة بيانات COCO128 وفوائد استخدام الفسيفساء (mosaicing) أثناء عملية التدريب.
Link to this sectionالاقتباسات والشكر#
إذا كنت تستخدم مجموعة بيانات COCO في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة التالية:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}نود أن نعرب عن تقديرنا لاتحاد COCO لإنشاء وصيانة هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات COCO ومبتكريها، تفضل بزيارة موقع مجموعة بيانات COCO.
Link to this sectionالأسئلة الشائعة#
Link to this sectionلماذا تُستخدم مجموعة بيانات Ultralytics COCO128؟#
تعد مجموعة بيانات Ultralytics COCO128 مجموعة فرعية مدمجة تحتوي على أول 128 صورة من مجموعة بيانات تدريب COCO لعام 2017. تُستخدم بشكل أساسي لاختبار وتصحيح نماذج كشف الأشياء، وتجربة أساليب كشف جديدة، والتحقق من صحة خطوط أنابيب التدريب قبل الانتقال إلى مجموعات بيانات أكبر. حجمها القابل للإدارة يجعلها مثالية للتكرارات السريعة مع توفير تنوع كافٍ لتكون حالة اختبار مفيدة.
Link to this sectionكيف يمكنني تدريب نموذج YOLO26 باستخدام مجموعة بيانات COCO128؟#
لتدريب نموذج YOLO26 على مجموعة بيانات COCO128، يمكنك استخدام Python أو أوامر CLI. وإليك الطريقة:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="coco128.yaml", epochs=100, imgsz=640)لمزيد من خيارات ومعلمات التدريب، ارجع إلى وثائق التدريب.
Link to this sectionما هي فوائد استخدام زيادة الفسيفساء (mosaic augmentation) مع COCO128؟#
تجمع زيادة الفسيفساء، كما هو موضح في صور العينة، صور تدريب متعددة في صورة مركبة واحدة. تقدم هذه التقنية العديد من المزايا عند التدريب باستخدام COCO128:
- زيادة تنوع الأشياء والسياقات داخل كل دفعة تدريب
- تحسين تعميم النموذج عبر أحجام ونسب عرض إلى ارتفاع مختلفة للأشياء
- تعزيز أداء الكشف للأشياء على نطاقات مختلفة
- تعظيم الاستفادة من مجموعة بيانات صغيرة عن طريق إنشاء عينات تدريب أكثر تنوعاً
تعد هذه التقنية قيمة بشكل خاص لمجموعات البيانات الصغيرة مثل COCO128، مما يساعد النماذج على تعلم ميزات أكثر قوة من البيانات المحدودة.
Link to this sectionكيف تقارن COCO128 بمتغيرات مجموعة بيانات COCO الأخرى؟#
تأتي COCO128 (128 صورة) في المنتصف بين COCO8 (8 صور) ومجموعة بيانات COCO الكاملة (أكثر من 118 ألف صورة) من حيث الحجم:
- COCO8: تحتوي على 8 صور فقط (4 للتدريب، 4 للتحقق) - مثالية للاختبارات السريعة وتصحيح الأخطاء
- COCO128: تحتوي على 128 صورة - متوازنة بين الحجم والتنوع
- COCO الكاملة: تحتوي على أكثر من 118 ألف صورة تدريب - شاملة ولكنها تستهلك الكثير من الموارد
توفر COCO128 أرضية وسطى جيدة، حيث توفر تنوعاً أكبر من COCO8 مع البقاء أكثر قابلية للإدارة بكثير من مجموعة بيانات COCO الكاملة للتجريب والتطوير الأولي للنموذج.
Link to this sectionهل يمكنني استخدام COCO128 لمهام أخرى غير كشف الأشياء؟#
على الرغم من أن COCO128 مصممة أساساً لكشف الأشياء، إلا أنه يمكن تكييف تعليقات مجموعة البيانات لمهام رؤية حاسوبية أخرى:
- تجزئة المثيلات (Instance segmentation): باستخدام أقنعة التجزئة المقدمة في التعليقات التوضيحية
- كشف النقاط الرئيسية (Keypoint detection): للصور التي تحتوي على أشخاص مع تعليقات توضيحية للنقاط الرئيسية
- التعلم بنقل المعرفة (Transfer learning): كنقطة انطلاق لضبط النماذج للمهام المخصصة
بالنسبة للمهام المتخصصة مثل التجزئة، فكر في استخدام متغيرات مبنية خصيصاً مثل COCO8-seg التي تتضمن التعليقات التوضيحية المناسبة.