تخطي إلى المحتوى

مجموعة البيانات متعددة الأطياف COCO8-Multispectral Dataset

مقدمة

ال Ultralytics مجموعة بيانات COCO8-Multispectral هي نسخة متطورة من مجموعة بيانات COCO8 الأصلية، وهي مصممة لتسهيل تجربة نماذج الكشف عن الأجسام متعددة الأطياف. وهي تتكون من نفس الصور الثماني من مجموعة بيانات COCO Train 2017 - 4 صور للتدريب و4 صور للتحقق من الصحة - ولكن مع تحويل كل صورة إلى تنسيق متعدد الأطياف ذي 10 قنوات. من خلال التوسع إلى ما هو أبعد من قنوات RGB القياسية، يتيح COCO8-Multispectral تطوير وتقييم النماذج التي يمكنها الاستفادة من المعلومات الطيفية الأكثر ثراءً.

نظرة عامة على الصور متعددة الأطياف

إن COCO8-Multispectral متوافق تمامًا مع Ultralytics HUB و YOLO11مما يضمن التكامل السلس في سير عمل الرؤية الحاسوبية لديك.

توليد مجموعة البيانات

تم إنشاء الصور متعددة الأطياف في COCO8-Multispectral من خلال استيفاء الصور الأصلية RGB عبر 10 قنوات طيفية متباعدة بشكل متساوٍ ضمن الطيف المرئي. تتضمن العملية ما يلي:

  • تعيين الطول الموجي: تعيين الأطوال الموجية الاسمية لقنوات RGB- الأحمر: 650 نانومتر، والأخضر: 510 نانومتر، أزرق: 475 نانومتر.
  • الاستيفاء: استخدام الاستيفاء الخطي لتقدير قيم البكسل عند الأطوال الموجية المتوسطة بين 450 نانومتر و700 نانومتر، مما ينتج عنه 10 قنوات طيفية.
  • الاستقراء: تطبيق الاستقراء باستخدام SciPy's interp1d لتقدير قيم تتجاوز أطوال موجات RGB الأصلية، مما يضمن تمثيلاً طيفيًا كاملاً.

يحاكي هذا النهج عملية التصوير متعدد الأطياف، مما يوفر مجموعة أكثر تنوعًا من البيانات لتدريب النموذج وتقييمه. لمزيد من القراءة عن التصوير متعدد الأطياف، راجع مقالة ويكيبيديا التصوير متعدد الأطياف.

مجموعة البيانات YAML

تتم تهيئة مجموعة بيانات COCO8-Multispectral باستخدام ملف YAML، والذي يحدد مسارات مجموعة البيانات، وأسماء الفئات، والبيانات الوصفية الأساسية. يمكنك مراجعة ملف coco8-multispectral.yaml في ملف Ultralytics مستودع GitHub.

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral  ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip

ملاحظة

قم بإعداد صور TIFF الخاصة بك في (channel, height, width) النظام وحفظها مع .tiff أو .tif ملحق للاستخدام مع Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

الاستخدام

لتدريب نموذج YOLO11n على مجموعة بيانات COCO8-Multispectral لـ 100 حلقة تدريبية بحجم صورة 640، استخدم الأمثلة التالية. للحصول على قائمة شاملة بخيارات التدريب، راجع وثائق تدريبYOLO .

مثال على القطار

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640

للمزيد من التفاصيل حول اختيار النموذج وأفضل الممارسات، يمكنك الاطلاع على وثائق نموذجYOLO الخاص بـ Ultralytics ودليل نصائح التدريب على نموذجYOLO .

عينة من الصور والتعليقات التوضيحية

فيما يلي مثال لدفعة تدريب مُفصّلة من مجموعة بيانات COCO8-Multispectral:

صورة عينة مجموعة البيانات

  • الصورة الفسيفسائية: توضح هذه الصورة دفعة تدريب حيث يتم دمج عدة صور لمجموعة بيانات باستخدام التكبير الفسيفسائي. تزيد زيادة الفسيفساء من تنوع الأجسام والمشاهد داخل كل دفعة، مما يساعد النموذج على التعميم بشكل أفضل على مختلف أحجام الأجسام ونسب الأبعاد والخلفيات.

تُعدّ هذه التقنية ذات قيمة خاصة لمجموعات البيانات الصغيرة مثل COCO8-Multispectral، حيث إنها تزيد من فائدة كل صورة أثناء التدريب.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات COCO في بحثك أو تطويرك، يرجى الاستشهاد بالورقة التالية:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

شكر خاص لاتحاد COCO Consortium على مساهماتهم المستمرة في مجتمع الرؤية الحاسوبية.

الأسئلة الشائعة

ما الغرض من استخدام مجموعة بيانات Ultralytics COCO8-Multispectral Dataset؟

صُممت مجموعة بيانات Ultralytics COCO8-Multispectral لاختبار وتصحيح نماذج اكتشاف الأجسام متعددة الأطياف بسرعة. مع وجود 8 صور فقط (4 صور للتدريب، و4 للتحقق من الصحة)، فهي مثالية للتحقق من YOLO الخاص بك والتأكد من أن كل شيء يعمل كما هو متوقع قبل التوسع إلى مجموعات بيانات أكبر. للحصول على المزيد من مجموعات البيانات لتجربتها، تفضل بزيارة كتالوج مجموعات بياناتUltralytics .

كيف تحسن البيانات متعددة الأطياف اكتشاف الأجسام؟

توفّر البيانات متعددة الأطياف معلومات طيفية إضافية تتجاوز معايير RGB القياسية، مما يمكّن النماذج من تمييز الأجسام بناءً على الاختلافات الدقيقة في الانعكاس عبر الأطوال الموجية. يمكن أن يعزز ذلك دقة الكشف، خاصةً في السيناريوهات الصعبة. تعرف على المزيد حول التصوير متعدد الأطياف وتطبيقاته في الرؤية الحاسوبية المتقدمة.

هل COCO8-Multispectral متوافق مع طرازات Ultralytics HUB و YOLO

نعم، إن COCO8-Multispectral متوافق تمامًا مع Ultralytics HUB وجميع نماذجYOLO بما في ذلك أحدث إصدار YOLO11. يتيح لك ذلك دمج مجموعة البيانات بسهولة في سير عمل التدريب والتحقق من الصحة.

أين يمكنني العثور على مزيد من المعلومات حول تقنيات تعزيز البيانات؟

للحصول على فهم أعمق لطرق زيادة البيانات مثل الفسيفساء وتأثيرها على أداء النموذج، راجع دليل زيادة بياناتYOLO ومدونةUltralytics حول زيادة البيانات.

هل يمكنني استخدام COCO8-Multispectral لأغراض القياس أو الأغراض التعليمية؟

بالتأكيد! إن صغر حجم COCO8-Multispectral وطبيعته متعددة الأطياف تجعله مثاليًا للقياس المعياري والعروض التوضيحية التعليمية ووضع نماذج أولية لبنى النماذج الجديدة. لمزيد من مجموعات البيانات المعيارية، راجع مجموعة بياناتUltralytics المعيارية.



📅 تم إنشاؤه منذ 1 شهر ✏️ تم التحديث منذ 29 يومًا

التعليقات