Meet YOLO26: next-gen vision AI.

Link to this sectionمجموعة بيانات COCO8-Multispectral#

Link to this sectionمقدمة#

تعد مجموعة بيانات Ultralytics COCO8-Multispectral نسخة متقدمة من مجموعة بيانات COCO8 الأصلية، وهي مصممة لتسهيل تجربة نماذج اكتشاف الأجسام متعددة الأطياف. تتكون المجموعة من نفس الـ 8 صور الموجودة في مجموعة تدريب COCO 2017—أربع صور للتدريب وأربع للتحقق—ولكن مع تحويل كل صورة إلى صيغة متعددة الأطياف ذات 10 قنوات. من خلال التوسع إلى ما وراء قنوات RGB القياسية، تتيح COCO8-Multispectral تطوير وتقييم النماذج التي يمكنها الاستفادة من معلومات طيفية أكثر ثراءً.

Multispectral imaging for object detection

مجموعة COCO8-Multispectral متوافقة تماماً مع منصة Ultralytics و YOLO26، مما يضمن تكاملاً سلساً في سير عمل الرؤية الحاسوبية الخاصة بك.



Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀

Link to this sectionإنشاء مجموعة البيانات#

تم إنشاء الصور متعددة الأطياف في COCO8-Multispectral عن طريق استيفاء صور RGB الأصلية عبر 10 قنوات طيفية موزعة بانتظام ضمن الطيف المرئي. تتضمن العملية ما يلي:

  • تخصيص الأطوال الموجية: تخصيص أطوال موجية اسمية لقنوات RGB—الأحمر: 650 نانومتر، الأخضر: 510 نانومتر، الأزرق: 475 نانومتر.
  • الاستيفاء: استخدام الاستيفاء الخطي لتقدير قيم البكسل عند أطوال موجية متوسطة بين 450 نانومتر و700 نانومتر، مما ينتج عنه 10 قنوات طيفية.
  • الاستقراء: تطبيق الاستقراء باستخدام دالة interp1d الخاصة بـ SciPy لتقدير القيم خارج نطاق أطوال موجات RGB الأصلية، مما يضمن تمثيلاً طيفياً كاملاً.

يحاكي هذا النهج عملية التصوير متعدد الأطياف، مما يوفر مجموعة أكثر تنوعاً من البيانات لتدريب النماذج وتقييمها. لمزيد من القراءة حول التصوير متعدد الأطياف، راجع مقالة ويكيبيديا حول التصوير متعدد الأطياف.

Link to this sectionYAML مجموعة البيانات#

تم تهيئة مجموعة بيانات COCO8-Multispectral باستخدام ملف YAML، والذي يحدد مسارات مجموعة البيانات، وأسماء الفئات، والبيانات الوصفية الأساسية. يمكنك مراجعة ملف coco8-multispectral.yaml الرسمي في مستودع Ultralytics على GitHub.

ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
ملاحظة

قم بإعداد صور TIFF الخاصة بك بترتيب (channel, height, width)، واحفظها بامتداد .tiff أو .tif، وتأكد من أنها بصيغة uint8 لاستخدامها مع Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

Link to this sectionالاستخدام#

لتدريب نموذج YOLO26n على مجموعة بيانات COCO8-Multispectral لمدة 100 عصر تدريبي (epoch) بحجم صورة 640، استخدم الأمثلة التالية. للحصول على قائمة شاملة بخيارات التدريب، راجع وثائق تدريب YOLO.

مثال على التدريب
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)

لمزيد من التفاصيل حول اختيار النموذج وأفضل الممارسات، استكشف وثائق نموذج Ultralytics YOLO و دليل نصائح تدريب نموذج YOLO.

Link to this sectionصور وشروحات توضيحية عينة#

فيما يلي مثال على دفعة تدريب مركبة (mosaiced) من مجموعة بيانات COCO8-Multispectral:

COCO8 multispectral dataset mosaic training batch
  • صورة مركبة (Mosaiced Image): توضح هذه الصورة دفعة تدريب حيث يتم دمج صور متعددة من مجموعة البيانات باستخدام تعزيز الفسيفساء (mosaic augmentation). يعمل تعزيز الفسيفساء على زيادة تنوع الأجسام والمشاهد داخل كل دفعة، مما يساعد النموذج على التعميم بشكل أفضل على أحجام الأجسام ونسب العرض إلى الارتفاع والخلفيات المختلفة.

تعد هذه التقنية قيمة بشكل خاص لمجموعات البيانات الصغيرة مثل COCO8-Multispectral، حيث إنها تزيد من فائدة كل صورة أثناء التدريب.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو تطويرك، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

شكر خاص لـ COCO Consortium على مساهماتهم المستمرة في مجتمع الرؤية الحاسوبية.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما الغرض من استخدام مجموعة بيانات Ultralytics COCO8-Multispectral؟#

تم تصميم مجموعة بيانات Ultralytics COCO8-Multispectral للاختبار السريع وتصحيح أخطاء نماذج اكتشاف الأجسام متعددة الأطياف. مع وجود 8 صور فقط (4 للتدريب، 4 للتحقق)، فهي مثالية للتحقق من مسارات تدريب YOLO26 الخاصة بك والتأكد من أن كل شيء يعمل كما هو متوقع قبل الانتقال إلى مجموعات بيانات أكبر. لمزيد من مجموعات البيانات للتجربة، قم بزيارة كتالوج مجموعات بيانات Ultralytics.

Link to this sectionكيف تحسن البيانات متعددة الأطياف من اكتشاف الأجسام؟#

توفر البيانات متعددة الأطياف معلومات طيفية إضافية تتجاوز RGB القياسي، مما يتيح للنماذج تمييز الأجسام بناءً على اختلافات دقيقة في الانعكاسية عبر الأطوال الموجية. يمكن أن يعزز هذا دقة الاكتشاف، خاصة في السيناريوهات الصعبة. تعرف على المزيد حول التصوير متعدد الأطياف وتطبيقاته في الرؤية الحاسوبية المتقدمة.

Link to this sectionهل COCO8-Multispectral متوافقة مع منصة Ultralytics ونماذج YOLO؟#

نعم، مجموعة COCO8-Multispectral متوافقة تماماً مع منصة Ultralytics وجميع نماذج YOLO، بما في ذلك أحدث إصدار YOLO26. يتيح لك هذا دمج مجموعة البيانات بسهولة في سير عمل التدريب والتحقق الخاص بك.

Link to this sectionأين يمكنني العثور على مزيد من المعلومات حول تقنيات تعزيز البيانات؟#

للحصول على فهم أعمق لطرق تعزيز البيانات مثل الفسيفساء (mosaic) وتأثيرها على أداء النموذج، راجع دليل تعزيز بيانات YOLO و مدونة Ultralytics حول تعزيز البيانات.

Link to this sectionهل يمكنني استخدام COCO8-Multispectral للمقارنة المعيارية أو لأغراض تعليمية؟#

بالتأكيد! إن الحجم الصغير والطبيعة متعددة الأطياف لـ COCO8-Multispectral يجعلها مثالية للمقارنة المعيارية، والعروض التوضيحية التعليمية، ونمذجة هندسات النماذج الجديدة. للمزيد من مجموعات بيانات المقارنة المعيارية، راجع مجموعة بيانات المعايير الخاصة بـ Ultralytics.

التعليقات