COCO8-Multispectral Veri Kümesi

Giriş

Ultralytics COCO8-Multispectral veri kümesi, çok spektrumlu nesne algılama modelleriyle denemeleri kolaylaştırmak için tasarlanmış, orijinal COCO8 veri kümesinin gelişmiş bir varyantıdır. Orijinal COCO train 2017 kümesinden alınan aynı 8 görüntüden (4'ü eğitim, 4'ü doğrulama için) oluşur, ancak her görüntü 10 kanallı çok spektrumlu bir formata dönüştürülmüştür. Standart RGB kanallarının ötesine geçen COCO8-Multispectral, daha zengin spektral bilgilerden yararlanabilen modellerin geliştirilmesini ve değerlendirilmesini mümkün kılar.

Multispectral imaging for object detection

COCO8-Multispectral, Ultralytics Platform ve YOLO26 ile tam uyumludur ve bilgisayarlı görü iş akışlarına sorunsuz entegrasyon sağlar.



Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀

Veri Kümesi Oluşturma

COCO8-Multispectral içindeki çok spektrumlu görüntüler, orijinal RGB görüntülerinin görünür spektrum içindeki 10 eşit aralıklı spektral kanal boyunca enterpolasyonu ile oluşturulmuştur. Süreç şunları içerir:

  • Dalga Boyu Atama: RGB kanallarına nominal dalga boylarının atanması—Kırmızı: 650 nm, Yeşil: 510 nm, Mavi: 475 nm.
  • Enterpolasyon: 450 nm ile 700 nm arasındaki dalga boylarında piksel değerlerini tahmin etmek için doğrusal enterpolasyon kullanılması ve sonuçta 10 spektral kanal elde edilmesi.
  • Ekstrapolasyon: Orijinal RGB dalga boylarının ötesindeki değerleri tahmin etmek için SciPy'nin interp1d fonksiyonu ile ekstrapolasyon uygulanması, böylece tam bir spektral temsilin sağlanması.

Bu yaklaşım, çok spektrumlu bir görüntüleme sürecini simüle ederek model eğitimi ve değerlendirmesi için daha çeşitli bir veri kümesi sağlar. Çok spektrumlu görüntüleme hakkında daha fazla okuma için Çok Spektrumlu Görüntüleme Wikipedia makalesine göz atabilirsin.

Veri Kümesi YAML Dosyası

COCO8-Multispectral veri kümesi, veri kümesi yollarını, sınıf adlarını ve temel meta verileri tanımlayan bir YAML dosyası kullanılarak yapılandırılmıştır. Resmi coco8-multispectral.yaml dosyasını Ultralytics GitHub deposunda inceleyebilirsin.

ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
Not

Prepare your TIFF images in (channel, height, width) order, saved with .tiff or .tif extension, and ensure they are uint8 for use with Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

Kullanım

COCO8-Multispectral veri kümesi üzerinde 640 görüntü boyutu ile 100 epoch boyunca bir YOLO26n modeli eğitmek için aşağıdaki örnekleri kullan. Eğitim seçeneklerinin kapsamlı bir listesi için YOLO Eğitim belgelerine başvur.

Eğitim Örneği
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)

Model seçimi ve en iyi uygulamalar hakkında daha fazla ayrıntı için Ultralytics YOLO model belgelerini ve YOLO Model Eğitimi İpuçları kılavuzunu keşfet.

Örnek Görüntüler ve Ek Açıklamalar

Aşağıda, COCO8-Multispectral veri kümesinden bir mozaik eğitim grubuna örnek verilmiştir:

COCO8 multispectral dataset mosaic training batch
  • Mozaik Görüntü: Bu görüntü, birden fazla veri kümesi görüntüsünün mozaik artırma kullanılarak birleştirildiği bir eğitim grubunu göstermektedir. Mozaik artırma, her grup içindeki nesne ve sahne çeşitliliğini artırarak modelin çeşitli nesne boyutlarına, en boy oranlarına ve arka planlara daha iyi uyum sağlamasına yardımcı olur.

Bu teknik, her görüntünün eğitim sırasındaki faydasını maksimize ettiği için COCO8-Multispectral gibi küçük veri kümeleri için özellikle değerlidir.

Alıntılar ve Teşekkür

Eğer COCO veri setini araştırmalarında veya geliştirmelerinde kullanıyorsan, lütfen şu makaleye atıfta bulun:

Alıntı
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Special thanks to the COCO Consortium for their ongoing contributions to the computer vision community.

SSS

Ultralytics COCO8-Multispectral Veri Kümesi Ne İçin Kullanılır?

Ultralytics COCO8-Multispectral veri kümesi, çok spektrumlu nesne algılama modellerinin hızlı testi ve hata ayıklaması için tasarlanmıştır. Sadece 8 görüntü ile (4'ü eğitim, 4'ü doğrulama için), YOLO26 eğitim hatlarını doğrulamak ve daha büyük veri kümelerine geçmeden önce her şeyin beklendiği gibi çalıştığından emin olmak için idealdir. Deneyebileceğin daha fazla veri kümesi için Ultralytics Veri Kümesi Kataloğu'nu ziyaret et.

Çok Spektrumlu Veriler Nesne Algılamayı Nasıl İyileştirir?

Çok spektrumlu veriler, standart RGB'nin ötesinde ek spektral bilgiler sağlayarak modellerin nesneleri dalga boyları arasındaki ince yansıma farklılıklarına göre ayırt etmesini sağlar. Bu, özellikle zorlu senaryolarda algılama doğruluğunu artırabilir. Çok spektrumlu görüntüleme ve ileri bilgisayarlı görü alanındaki uygulamaları hakkında daha fazla bilgi edin.

COCO8-Multispectral, Ultralytics Platformu ve YOLO Modelleri ile Uyumlu mu?

Evet, COCO8-Multispectral, Ultralytics Platform ve en yeni YOLO26 dahil olmak üzere tüm YOLO modelleri ile tam uyumludur. Bu, veri kümesini eğitim ve doğrulama iş akışlarına kolayca entegre etmeni sağlar.

Veri Artırma Teknikleri Hakkında Daha Fazla Bilgiyi Nerede Bulabilirim?

Mozaik gibi veri artırma yöntemleri ve bunların model performansı üzerindeki etkisi hakkında daha derin bir anlayış için YOLO Veri Artırma Kılavuzu'na ve Ultralytics Veri Artırma Bloğu'na başvur.

COCO8-Multispectral'ı Kıyaslama veya Eğitim Amaçlı Kullanabilir miyim?

Kesinlikle! COCO8-Multispectral'ın küçük boyutu ve çok spektrumlu yapısı, onu kıyaslama, eğitimsel gösterimler ve yeni model mimarileri prototipleme için ideal kılar. Daha fazla kıyaslama veri kümesi için Ultralytics Kıyaslama Veri Kümesi Koleksiyonu'na bak.

Yorumlar