COCO8-Multispectral Veri Kümesi
Giriş
Ultralytics COCO8-Multispectral veri kümesi, çok spektrumlu nesne algılama modelleriyle denemeleri kolaylaştırmak için tasarlanmış, orijinal COCO8 veri kümesinin gelişmiş bir varyantıdır. Orijinal COCO train 2017 kümesinden alınan aynı 8 görüntüden (4'ü eğitim, 4'ü doğrulama için) oluşur, ancak her görüntü 10 kanallı çok spektrumlu bir formata dönüştürülmüştür. Standart RGB kanallarının ötesine geçen COCO8-Multispectral, daha zengin spektral bilgilerden yararlanabilen modellerin geliştirilmesini ve değerlendirilmesini mümkün kılar.
COCO8-Multispectral, Ultralytics Platform ve YOLO26 ile tam uyumludur ve bilgisayarlı görü iş akışlarına sorunsuz entegrasyon sağlar.
Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀
Veri Kümesi Oluşturma
COCO8-Multispectral içindeki çok spektrumlu görüntüler, orijinal RGB görüntülerinin görünür spektrum içindeki 10 eşit aralıklı spektral kanal boyunca enterpolasyonu ile oluşturulmuştur. Süreç şunları içerir:
- Dalga Boyu Atama: RGB kanallarına nominal dalga boylarının atanması—Kırmızı: 650 nm, Yeşil: 510 nm, Mavi: 475 nm.
- Enterpolasyon: 450 nm ile 700 nm arasındaki dalga boylarında piksel değerlerini tahmin etmek için doğrusal enterpolasyon kullanılması ve sonuçta 10 spektral kanal elde edilmesi.
- Ekstrapolasyon: Orijinal RGB dalga boylarının ötesindeki değerleri tahmin etmek için SciPy'nin
interp1dfonksiyonu ile ekstrapolasyon uygulanması, böylece tam bir spektral temsilin sağlanması.
Bu yaklaşım, çok spektrumlu bir görüntüleme sürecini simüle ederek model eğitimi ve değerlendirmesi için daha çeşitli bir veri kümesi sağlar. Çok spektrumlu görüntüleme hakkında daha fazla okuma için Çok Spektrumlu Görüntüleme Wikipedia makalesine göz atabilirsin.
Veri Kümesi YAML Dosyası
COCO8-Multispectral veri kümesi, veri kümesi yollarını, sınıf adlarını ve temel meta verileri tanımlayan bir YAML dosyası kullanılarak yapılandırılmıştır. Resmi coco8-multispectral.yaml dosyasını Ultralytics GitHub deposunda inceleyebilirsin.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zipPrepare your TIFF images in (channel, height, width) order, saved with .tiff or .tif extension, and ensure they are uint8 for use with Ultralytics:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inferenceKullanım
COCO8-Multispectral veri kümesi üzerinde 640 görüntü boyutu ile 100 epoch boyunca bir YOLO26n modeli eğitmek için aşağıdaki örnekleri kullan. Eğitim seçeneklerinin kapsamlı bir listesi için YOLO Eğitim belgelerine başvur.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)Model seçimi ve en iyi uygulamalar hakkında daha fazla ayrıntı için Ultralytics YOLO model belgelerini ve YOLO Model Eğitimi İpuçları kılavuzunu keşfet.
Örnek Görüntüler ve Ek Açıklamalar
Aşağıda, COCO8-Multispectral veri kümesinden bir mozaik eğitim grubuna örnek verilmiştir:
- Mozaik Görüntü: Bu görüntü, birden fazla veri kümesi görüntüsünün mozaik artırma kullanılarak birleştirildiği bir eğitim grubunu göstermektedir. Mozaik artırma, her grup içindeki nesne ve sahne çeşitliliğini artırarak modelin çeşitli nesne boyutlarına, en boy oranlarına ve arka planlara daha iyi uyum sağlamasına yardımcı olur.
Bu teknik, her görüntünün eğitim sırasındaki faydasını maksimize ettiği için COCO8-Multispectral gibi küçük veri kümeleri için özellikle değerlidir.
Alıntılar ve Teşekkür
Eğer COCO veri setini araştırmalarında veya geliştirmelerinde kullanıyorsan, lütfen şu makaleye atıfta bulun:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}Special thanks to the COCO Consortium for their ongoing contributions to the computer vision community.
SSS
Ultralytics COCO8-Multispectral Veri Kümesi Ne İçin Kullanılır?
Ultralytics COCO8-Multispectral veri kümesi, çok spektrumlu nesne algılama modellerinin hızlı testi ve hata ayıklaması için tasarlanmıştır. Sadece 8 görüntü ile (4'ü eğitim, 4'ü doğrulama için), YOLO26 eğitim hatlarını doğrulamak ve daha büyük veri kümelerine geçmeden önce her şeyin beklendiği gibi çalıştığından emin olmak için idealdir. Deneyebileceğin daha fazla veri kümesi için Ultralytics Veri Kümesi Kataloğu'nu ziyaret et.
Çok Spektrumlu Veriler Nesne Algılamayı Nasıl İyileştirir?
Çok spektrumlu veriler, standart RGB'nin ötesinde ek spektral bilgiler sağlayarak modellerin nesneleri dalga boyları arasındaki ince yansıma farklılıklarına göre ayırt etmesini sağlar. Bu, özellikle zorlu senaryolarda algılama doğruluğunu artırabilir. Çok spektrumlu görüntüleme ve ileri bilgisayarlı görü alanındaki uygulamaları hakkında daha fazla bilgi edin.
COCO8-Multispectral, Ultralytics Platformu ve YOLO Modelleri ile Uyumlu mu?
Evet, COCO8-Multispectral, Ultralytics Platform ve en yeni YOLO26 dahil olmak üzere tüm YOLO modelleri ile tam uyumludur. Bu, veri kümesini eğitim ve doğrulama iş akışlarına kolayca entegre etmeni sağlar.
Veri Artırma Teknikleri Hakkında Daha Fazla Bilgiyi Nerede Bulabilirim?
Mozaik gibi veri artırma yöntemleri ve bunların model performansı üzerindeki etkisi hakkında daha derin bir anlayış için YOLO Veri Artırma Kılavuzu'na ve Ultralytics Veri Artırma Bloğu'na başvur.
COCO8-Multispectral'ı Kıyaslama veya Eğitim Amaçlı Kullanabilir miyim?
Kesinlikle! COCO8-Multispectral'ın küçük boyutu ve çok spektrumlu yapısı, onu kıyaslama, eğitimsel gösterimler ve yeni model mimarileri prototipleme için ideal kılar. Daha fazla kıyaslama veri kümesi için Ultralytics Kıyaslama Veri Kümesi Koleksiyonu'na bak.