COCO8-Multispectral 데이터셋

소개

Ultralytics COCO8-Multispectral 데이터셋은 다중 스펙트럼 객체 탐지 모델 실험을 원활하게 하기 위해 설계된 기존 COCO8 데이터셋의 고급 변형입니다. 이 데이터셋은 COCO train 2017 세트의 동일한 이미지 8장(훈련용 4장, 검증용 4장)으로 구성되어 있지만, 각 이미지가 10채널 다중 스펙트럼 형식으로 변환되어 있습니다. 표준 RGB 채널을 넘어 확장된 COCO8-Multispectral을 통해 더 풍부한 스펙트럼 정보를 활용하는 모델을 개발하고 평가할 수 있습니다.

Multispectral imaging for object detection

COCO8-Multispectral은 Ultralytics PlatformYOLO26과 완벽하게 호환되므로 컴퓨터 비전 워크플로우에 원활하게 통합할 수 있습니다.



Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀

데이터셋 생성

COCO8-Multispectral의 다중 스펙트럼 이미지는 가시광선 스펙트럼 내에서 동일한 간격으로 배치된 10개의 스펙트럼 채널에 걸쳐 원본 RGB 이미지를 보간하여 생성되었습니다. 이 과정은 다음을 포함합니다:

  • 파장 할당: RGB 채널에 공칭 파장을 할당합니다(적색: 650 nm, 녹색: 510 nm, 청색: 475 nm).
  • 보간(Interpolation): 선형 보간법을 사용하여 450 nm에서 700 nm 사이의 중간 파장에서 픽셀 값을 추정하며, 그 결과 10개의 스펙트럼 채널이 생성됩니다.
  • 외삽(Extrapolation): SciPy의 interp1d 함수를 사용하여 외삽을 적용함으로써 원본 RGB 파장 범위를 벗어난 값을 추정하고, 완전한 스펙트럼 표현을 보장합니다.

이 접근 방식은 다중 스펙트럼 이미징 프로세스를 시뮬레이션하여 모델 훈련 및 평가를 위한 더욱 다양한 데이터셋을 제공합니다. 다중 스펙트럼 이미징에 대한 자세한 내용은 Multispectral Imaging Wikipedia 문서를 참조하십시오.

데이터셋 YAML

The COCO8-Multispectral dataset is configured using a YAML file, which defines dataset paths, class names, and essential metadata. You can review the official coco8-multispectral.yaml file in the Ultralytics GitHub repository.

ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
참고

Prepare your TIFF images in (channel, height, width) order, saved with .tiff or .tif extension, and ensure they are uint8 for use with Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

사용법

COCO8-Multispectral 데이터셋에서 640 이미지 크기로 100 에폭(epochs) 동안 YOLO26n 모델을 훈련하려면 다음 예제를 사용하십시오. 포괄적인 훈련 옵션 목록은 YOLO 훈련 문서를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)

모델 선택 및 모범 사례에 대한 자세한 내용은 Ultralytics YOLO 모델 문서YOLO 모델 훈련 팁 가이드를 확인하십시오.

샘플 이미지 및 주석

다음은 COCO8-Multispectral 데이터셋의 모자이크 처리된 훈련 배치 예시입니다:

COCO8 multispectral dataset mosaic training batch
  • 모자이크 이미지: 이 이미지는 여러 데이터셋 이미지를 모자이크 증강(mosaic augmentation)을 사용하여 결합한 훈련 배치를 보여줍니다. 모자이크 증강은 각 배치 내 객체와 장면의 다양성을 증가시켜 모델이 다양한 객체 크기, 종횡비 및 배경에 더 잘 일반화되도록 돕습니다.

이 기술은 훈련 중 각 이미지의 활용도를 극대화하므로 COCO8-Multispectral과 같은 소규모 데이터셋에 특히 유용합니다.

인용 및 감사의 글

연구나 개발에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:

인용
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Special thanks to the COCO Consortium for their ongoing contributions to the computer vision community.

FAQ

Ultralytics COCO8-Multispectral 데이터셋은 무엇에 사용됩니까?

Ultralytics COCO8-Multispectral 데이터셋은 다중 스펙트럼 객체 탐지 모델의 빠른 테스트 및 디버깅을 위해 설계되었습니다. 8개의 이미지만 포함되어 있어(훈련용 4개, 검증용 4개) YOLO26 훈련 파이프라인을 검증하고 더 큰 데이터셋으로 확장하기 전에 모든 것이 예상대로 작동하는지 확인하는 데 이상적입니다. 실험할 더 많은 데이터셋을 보려면 Ultralytics 데이터셋 카탈로그를 방문하십시오.

다중 스펙트럼 데이터는 어떻게 객체 탐지를 개선합니까?

다중 스펙트럼 데이터는 표준 RGB를 넘어 추가적인 스펙트럼 정보를 제공하여 모델이 파장에 따른 반사율의 미묘한 차이를 기반으로 객체를 구별할 수 있게 합니다. 이는 특히 어려운 시나리오에서 탐지 정확도를 향상시킬 수 있습니다. 다중 스펙트럼 이미징고급 컴퓨터 비전에서의 응용 분야에 대해 자세히 알아보십시오.

COCO8-Multispectral은 Ultralytics Platform 및 YOLO 모델과 호환됩니까?

네, COCO8-Multispectral은 Ultralytics Platform 및 최신 YOLO26을 포함한 모든 YOLO 모델과 완벽하게 호환됩니다. 이를 통해 데이터셋을 훈련 및 검증 워크플로우에 쉽게 통합할 수 있습니다.

데이터 증강 기술에 대한 자세한 정보는 어디에서 찾을 수 있습니까?

모자이크와 같은 데이터 증강 방법과 그것이 모델 성능에 미치는 영향에 대한 더 깊은 이해를 위해 YOLO 데이터 증강 가이드데이터 증강에 관한 Ultralytics 블로그를 참조하십시오.

COCO8-Multispectral을 벤치마킹이나 교육 목적으로 사용할 수 있습니까?

물론입니다! COCO8-Multispectral의 작은 크기와 다중 스펙트럼 특성은 벤치마킹, 교육용 시연 및 새로운 모델 아키텍처 프로토타이핑에 이상적입니다. 더 많은 벤치마킹 데이터셋은 Ultralytics 벤치마크 데이터셋 컬렉션을 확인하십시오.

댓글