مجموعة بيانات COCO8-Multispectral

مقدمة

تُعد مجموعة بيانات Ultralytics COCO8-Multispectral نسخة متقدمة من مجموعة بيانات COCO8 الأصلية، مصممة لتسهيل التجريب مع نماذج detect الكائنات متعددة الأطياف. تتكون من نفس الـ 8 صور من مجموعة COCO train 2017 — 4 للتدريب و 4 للتحقق — ولكن مع تحويل كل صورة إلى تنسيق متعدد الأطياف بـ 10 قنوات. من خلال التوسع إلى ما هو أبعد من قنوات RGB القياسية، تتيح COCO8-Multispectral تطوير وتقييم النماذج التي يمكنها الاستفادة من معلومات طيفية أكثر ثراءً.

التصوير متعدد الأطياف لاكتشاف الأجسام

تتوافق COCO8-Multispectral تمامًا مع منصة Ultralytics وYOLO26، مما يضمن التكامل السلس في سير عمل الرؤية الحاسوبية الخاص بك.

شاهد: كيفية تدريب Ultralytics YOLO26 على مجموعات البيانات متعددة الأطياف | رؤية حاسوبية متعددة القنوات 🚀

إنشاء مجموعة البيانات

تم إنشاء الصور متعددة الأطياف في COCO8-Multispectral عن طريق استيفاء صور RGB الأصلية عبر 10 قنوات طيفية متباعدة بالتساوي داخل الطيف المرئي. تتضمن العملية:

تخصيص الطول الموجي: تخصيص الأطوال الموجية الاسمية لقنوات RGB—الأحمر: 650 نانومتر، الأخضر: 510 نانومتر، الأزرق: 475 نانومتر.
الاستيفاء: استخدام الاستيفاء الخطي لتقدير قيم البكسل بأطوال موجية وسيطة بين 450 نانومتر و 700 نانومتر، مما يؤدي إلى 10 قنوات طيفية.
الاستقراء: تطبيق الاستقراء باستخدام SciPy's interp1d دالة لتقدير القيم خارج الأطوال الموجية RGB الأصلية، مما يضمن تمثيلًا طيفيًا كاملاً.

يحاكي هذا الأسلوب عملية التصوير متعدد الأطياف، مما يوفر مجموعة بيانات أكثر تنوعًا لتدريب النموذج وتقييمه. لمزيد من القراءة حول التصوير متعدد الأطياف، راجع مقالة التصوير متعدد الأطياف في ويكيبيديا.

ملف YAML لمجموعة البيانات

تم تكوين مجموعة بيانات COCO8-Multispectral باستخدام ملف YAML، والذي يحدد مسارات مجموعة البيانات وأسماء الفئات وبيانات التعريف الأساسية. يمكنك مراجعة coco8-multispectral.yaml الملف في مستودع Ultralytics GitHub.

ultralytics/cfg/datasets/coco8-multispectral.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip

ملاحظة

قم بإعداد صور TIFF الخاصة بك في (channel, height, width) الطلب، تم حفظه مع .tiff أو .tif الامتداد، والتأكد من أنها uint8 للاستخدام مع Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

الاستخدام

لتدريب نموذج YOLO26n على مجموعة بيانات COCO8-Multispectral لمدة 100 حقبة بحجم صورة 640، استخدم الأمثلة التالية. للحصول على قائمة شاملة بخيارات التدريب، ارجع إلى وثائق تدريب YOLO.

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)

# Train YOLO26n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo26n.pt epochs=100 imgsz=640

لمزيد من التفاصيل حول اختيار النموذج وأفضل الممارسات، استكشف وثائق نموذج Ultralytics YOLO و دليل نصائح تدريب نموذج YOLO.

عينات من الصور والشروحات التوضيحية

فيما يلي مثال على دفعة تدريب مُجمَّعة من مجموعة بيانات COCO8-Multispectral:

دفعة تدريب فسيفساء مجموعة بيانات COCO8

صورة الفسيفساء: توضح هذه الصورة دفعة تدريب يتم فيها دمج صور متعددة لمجموعة البيانات باستخدام زيادة الفسيفساء. تزيد زيادة الفسيفساء من تنوع الكائنات والمشاهد داخل كل دفعة، مما يساعد النموذج على التعميم بشكل أفضل لأحجام الكائنات ونسب العرض إلى الارتفاع والخلفيات المختلفة.

تعتبر هذه التقنية ذات قيمة خاصة لمجموعات البيانات الصغيرة مثل COCO8-Multispectral، لأنها تزيد من فائدة كل صورة أثناء التدريب.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو تطويرك، فيرجى الاستشهاد بالورقة التالية:

BibTeX

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

شكر خاص لـ COCO Consortium لمساهماتهم المستمرة في مجتمع رؤية الكمبيوتر.

الأسئلة الشائعة

فيما تستخدم مجموعة بيانات Ultralytics COCO8-Multispectral؟

تم تصميم مجموعة بيانات Ultralytics COCO8-Multispectral للاختبار السريع وتصحيح أخطاء نماذج اكتشاف الكائنات متعددة الأطياف. بوجود 8 صور فقط (4 للتدريب، 4 للتحقق)، تعد مثالية للتحقق من مسارات تدريب YOLO26 الخاصة بك والتأكد من أن كل شيء يعمل كما هو متوقع قبل التوسع إلى مجموعات بيانات أكبر. لمزيد من مجموعات البيانات للتجربة، قم بزيارة كتالوج مجموعات بيانات Ultralytics.

كيف تعمل البيانات متعددة الأطياف على تحسين اكتشاف الكائنات؟

توفر البيانات متعددة الأطياف معلومات طيفية إضافية تتجاوز RGB القياسية، مما يمكّن النماذج من تمييز الكائنات بناءً على اختلافات طفيفة في الانعكاس عبر الأطوال الموجية. يمكن أن يؤدي ذلك إلى تحسين دقة الكشف، خاصة في السيناريوهات الصعبة. تعرف على المزيد حول التصوير متعدد الأطياف وتطبيقاته في رؤية الكمبيوتر المتقدمة.

هل تتوافق COCO8-Multispectral مع منصة Ultralytics ونماذج YOLO؟

نعم، تتوافق COCO8-Multispectral تمامًا مع منصة Ultralytics وجميع نماذج YOLO، بما في ذلك أحدث إصدار YOLO26. يتيح لك هذا دمج مجموعة البيانات بسهولة في سير عمل التدريب والتحقق الخاص بك.

أين يمكنني العثور على مزيد من المعلومات حول تقنيات زيادة البيانات؟

لفهم أعمق لطرق زيادة البيانات مثل الفسيفساء وتأثيرها على أداء النموذج، ارجع إلى دليل زيادة بيانات YOLO و مدونة Ultralytics حول زيادة البيانات.

هل يمكنني استخدام COCO8-متعدد الأطياف لأغراض القياس أو التعليم؟

بالتأكيد! إن الحجم الصغير والطبيعة متعددة الأطياف لـ COCO8-Multispectral تجعلها مثالية لتقييم الأداء والعروض التوضيحية التعليمية ونماذج أولية لبنى النماذج الجديدة. لمزيد من مجموعات بيانات قياس الأداء، راجع Ultralytics Benchmark Dataset Collection.

📅 تم الإنشاء قبل 1 عام ✏️ تم التحديث قبل 3 أشهر