COCO8-Multispektral Veri Seti
Giriş
Bu Ultralytics COCO8-Multispektral veri kümesi, multispektral nesne algılama modelleriyle deney yapmayı kolaylaştırmak için tasarlanmış orijinal COCO8 veri kümesinin gelişmiş bir çeşididir. COCO train 2017 setindeki aynı 8 görüntüden oluşur - eğitim için 4 ve doğrulama için 4 - ancak her görüntü 10 kanallı multispektral formata dönüştürülmüştür. COCO8-Multispectral, standart RGB kanallarının ötesine geçerek daha zengin spektral bilgilerden yararlanabilen modellerin geliştirilmesini ve değerlendirilmesini sağlar.
COCO8-Multispectral, Ultralytics HUB ile tamamen uyumludur ve YOLO11bilgisayarla görme iş akışlarınıza sorunsuz entegrasyon sağlar.
Veri Kümesi Oluşturma
COCO8-Multispectral'deki multispektral görüntüler, orijinal RGB görüntülerinin görünür spektrumdaki eşit aralıklı 10 spektral kanal boyunca enterpole edilmesiyle oluşturulmuştur. Bu işlem şunları içerir:
- Dalga Boyu Ataması: RGB kanallarına nominal dalga boylarının atanması-Kırmızı: 650 nm, Yeşil: 510 nm, Mavi: 475 nm.
- Enterpolasyon: Piksel değerlerini 450 nm ile 700 nm arasındaki ara dalga boylarında tahmin etmek için doğrusal enterpolasyon kullanarak 10 spektral kanal elde edilir.
- Ekstrapolasyon: SciPy ile ekstrapolasyon uygulama
interp1d
fonksiyonu, orijinal RGB dalga boylarının ötesindeki değerleri tahmin ederek eksiksiz bir spektral temsil sağlar.
Bu yaklaşım, çok bantlı görüntüleme sürecini simüle ederek model eğitimi ve değerlendirmesi için daha çeşitli bir veri seti sağlar. Multispektral görüntüleme hakkında daha fazla bilgi için Multispektral Görüntüleme Wikipedia makalesine bakınız.
Veri Kümesi YAML
COCO8-Multispectral veri seti, veri seti yollarını, sınıf adlarını ve temel meta verileri tanımlayan bir YAML dosyası kullanılarak yapılandırılır. Resmi dosyayı inceleyebilirsiniz coco8-multispectral.yaml
içindeki dosya Ultralytics GitHub deposu.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
Not
TIFF görüntülerinizi şurada hazırlayın (channel, height, width)
sırası ile kaydedilir ve .tiff
veya .tif
Ultralytics ile kullanım için uzantı:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inference
Kullanım
Bir YOLO11n modelini COCO8-Multispectral veri kümesi üzerinde 640 görüntü boyutuyla 100 epok için eğitmek için aşağıdaki örnekleri kullanın. Eğitim seçeneklerinin kapsamlı bir listesi için YOLO Eğitim belgelerine bakın.
Tren Örneği
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640
Model seçimi ve en iyi uygulamalar hakkında daha fazla ayrıntı için Ultralytics YOLO modeli belgelerini ve YOLO Modeli Eğitim İpuçları kılavuzunu inceleyin.
Örnek Görüntüler ve Açıklamalar
Aşağıda COCO8-Multispectral veri kümesinden mozaiklenmiş bir eğitim yığını örneği yer almaktadır:
- Mozaiklenmiş Görüntü: Bu görüntü, birden fazla veri kümesi görüntüsünün mozaik büyütme kullanılarak birleştirildiği bir eğitim grubunu göstermektedir. Mozaik büyütme, her bir yığın içindeki nesnelerin ve sahnelerin çeşitliliğini artırarak modelin çeşitli nesne boyutlarına, en-boy oranlarına ve arka planlara daha iyi genelleme yapmasına yardımcı olur.
Bu teknik, eğitim sırasında her görüntünün faydasını en üst düzeye çıkardığı için özellikle COCO8-Multispectral gibi küçük veri kümeleri için değerlidir.
Atıflar ve Teşekkür
Araştırma veya geliştirme çalışmalarınızda COCO veri setini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
COCO Konsorsiyumu 'na bilgisayarla görme topluluğuna devam eden katkıları için özel olarak teşekkür ederiz.
SSS
Ultralytics COCO8-Multispektral Veri Seti Ne İçin Kullanılır?
Ultralytics COCO8-Multispektral veri seti, multispektral nesne algılama modellerinin hızlı bir şekilde test edilmesi ve hata ayıklanması için tasarlanmıştır. Yalnızca 8 görüntü (4'ü eğitim, 4'ü doğrulama için) ile YOLO eğitim boru hatları ve daha büyük veri kümelerine ölçeklendirmeden önce her şeyin beklendiği gibi çalıştığından emin olun. Deneyebileceğiniz daha fazla veri kümesi için Ultralytics Veri Kümeleri Kataloğu'nu ziyaret edin.
Multispektral Veri Nesne Tespitini Nasıl İyileştirir?
Multispektral veriler, standart RGB'nin ötesinde ek spektral bilgiler sağlayarak modellerin nesneleri dalga boyları arasındaki yansımadaki ince farklılıklara göre ayırt etmesine olanak tanır. Bu, özellikle zorlu senaryolarda algılama doğruluğunu artırabilir. Multispektral görüntüleme ve gelişmiş bilgisayarla görme alanındaki uygulamaları hakkında daha fazla bilgi edinin.
COCO8-Multispectral Ultralytics HUB ve YOLO Modelleri ile Uyumlu mu?
Evet, COCO8-Multispectral, Ultralytics HUB ve en son YOLO11 de dahil olmak üzere tüm YOLO modelleriyle tamamen uyumludur. Bu, veri setini eğitim ve doğrulama iş akışlarınıza kolayca entegre etmenizi sağlar.
Veri Artırma Teknikleri Hakkında Daha Fazla Bilgiyi Nerede Bulabilirim?
Mozaik gibi veri büyütme yöntemlerini ve bunların model performansı üzerindeki etkilerini daha iyi anlamak için YOLO Veri Büyütme Kılavuzu 'na ve Veri Büyütme hakkındakiUltralytics Blogu'na bakın.
COCO8-Multispectral'ı Kıyaslama veya Eğitim Amaçlı Kullanabilir miyim?
Kesinlikle! COCO8-Multispectral'in küçük boyutu ve çok spektrumlu yapısı, onu kıyaslama, eğitim amaçlı gösterimler ve yeni model mimarilerinin prototipini oluşturmak için ideal kılar. Daha fazla kıyaslama veri seti için Ultralytics Kıyaslama Veri Seti Koleksiyonu'na bakın.