Link to this sectionCOCO8-Multispectral 데이터셋#
Link to this section소개#
Ultralytics COCO8-Multispectral 데이터셋은 다중 스펙트럼 객체 탐지 모델 실험을 용이하게 하도록 설계된 원본 COCO8 데이터셋의 고급 변형입니다. 이 데이터셋은 COCO train 2017 세트의 동일한 8개 이미지(학습용 4개, 검증용 4개)로 구성되어 있으나, 각 이미지가 10채널 다중 스펙트럼 형식으로 변환되었습니다. 표준 RGB 채널을 넘어 확장함으로써 COCO8-Multispectral은 더 풍부한 스펙트럼 정보를 활용할 수 있는 모델을 개발하고 평가할 수 있게 합니다.
COCO8-Multispectral은 Ultralytics Platform 및 YOLO26과 완벽하게 호환되어 computer vision 워크플로우에 원활하게 통합될 수 있습니다.
Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀
Link to this section데이터셋 생성#
COCO8-Multispectral의 다중 스펙트럼 이미지는 가시광선 스펙트럼 내에서 균일하게 간격을 둔 10개의 스펙트럼 채널에 걸쳐 원본 RGB 이미지를 보간하여 생성되었습니다. 이 과정에는 다음이 포함됩니다:
- 파장 할당: RGB 채널에 공칭 파장을 할당합니다(빨간색: 650 nm, 녹색: 510 nm, 파란색: 475 nm).
- 보간: 선형 보간을 사용하여 450 nm와 700 nm 사이의 중간 파장에서 픽셀 값을 추정하며, 결과적으로 10개의 스펙트럼 채널이 생성됩니다.
- 외삽: SciPy의
interp1d함수를 사용한 외삽을 적용하여 원본 RGB 파장 범위를 벗어난 값을 추정함으로써 완전한 스펙트럼 표현을 보장합니다.
이 접근 방식은 다중 스펙트럼 이미징 과정을 시뮬레이션하여 모델 학습 및 평가를 위한 더욱 다양한 데이터 세트를 제공합니다. 다중 스펙트럼 이미징에 대한 추가 정보는 Multispectral Imaging Wikipedia 문서를 참조하십시오.
Link to this section데이터셋 YAML#
The COCO8-Multispectral dataset is configured using a YAML file, which defines dataset paths, class names, and essential metadata. You can review the official coco8-multispectral.yaml file in the Ultralytics GitHub repository.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zipTIFF 이미지를 (channel, height, width) 순서로 준비하고 .tiff 또는 .tif 확장자로 저장하십시오. 또한 Ultralytics와 함께 사용할 수 있도록 uint8 형식인지 확인하십시오:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inferenceLink to this section사용법#
COCO8-Multispectral 데이터셋에서 100 epochs 동안 이미지 크기 640으로 YOLO26n 모델을 학습하려면 다음 예제를 사용하십시오. 포괄적인 학습 옵션 목록은 YOLO 학습 문서를 참조하십시오.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)모델 선택 및 모범 사례에 대한 자세한 내용은 Ultralytics YOLO 모델 문서 및 YOLO 모델 학습 팁 가이드를 확인하십시오.
Link to this section샘플 이미지 및 주석#
다음은 COCO8-Multispectral 데이터셋에서 모자이크 처리된 학습 배치 예제입니다:
- 모자이크 이미지: 이 이미지는 mosaic augmentation을 사용하여 여러 데이터셋 이미지를 결합한 학습 배치를 보여줍니다. 모자이크 증강은 각 배치 내 객체와 장면의 다양성을 증가시켜 모델이 다양한 객체 크기, 가로세로 비율 및 배경에 더 잘 일반화되도록 돕습니다.
이 기법은 학습 중 각 이미지의 유용성을 극대화하므로 COCO8-Multispectral과 같은 작은 데이터셋에 특히 유용합니다.
Link to this section인용 및 감사의 글#
연구나 개발에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}Special thanks to the COCO Consortium for their ongoing contributions to the computer vision community.
Link to this sectionFAQ#
Link to this sectionUltralytics COCO8-Multispectral 데이터셋은 어떤 용도로 사용됩니까?#
Ultralytics COCO8-Multispectral 데이터셋은 multispectral object detection 모델의 신속한 테스트 및 디버깅을 위해 설계되었습니다. 8개의 이미지만 포함되어 있으므로(학습용 4개, 검증용 4개) YOLO26 학습 파이프라인을 확인하고 더 큰 데이터셋으로 확장하기 전에 모든 것이 예상대로 작동하는지 확인하는 데 이상적입니다. 실험할 추가 데이터셋은 Ultralytics 데이터셋 카탈로그를 방문하십시오.
Link to this section다중 스펙트럼 데이터는 객체 탐지를 어떻게 향상시킵니까?#
다중 스펙트럼 데이터는 표준 RGB를 넘어 추가적인 스펙트럼 정보를 제공하여 모델이 파장에 따른 반사율의 미세한 차이를 기반으로 객체를 구분할 수 있게 합니다. 이는 특히 어려운 시나리오에서 탐지 정확도를 향상시킬 수 있습니다. multispectral imaging 및 advanced computer vision에서의 응용 분야에 대해 자세히 알아보십시오.
Link to this sectionCOCO8-Multispectral은 Ultralytics Platform 및 YOLO 모델과 호환됩니까?#
네, COCO8-Multispectral은 Ultralytics Platform 및 최신 YOLO26을 포함한 모든 YOLO 모델과 완벽하게 호환됩니다. 이를 통해 학습 및 검증 워크플로우에 데이터셋을 쉽게 통합할 수 있습니다.
Link to this section데이터 증강 기법에 대한 자세한 정보는 어디에서 찾을 수 있습니까?#
모자이크와 같은 데이터 증강 방법과 그것이 모델 성능에 미치는 영향에 대한 깊은 이해를 위해 YOLO 데이터 증강 가이드 및 데이터 증강에 관한 Ultralytics 블로그를 참조하십시오.
Link to this sectionCOCO8-Multispectral을 벤치마킹이나 교육 목적으로 사용할 수 있습니까?#
물론입니다! COCO8-Multispectral은 작은 크기와 다중 스펙트럼 특성 덕분에 벤치마킹, 교육용 데모 및 새로운 모델 아키텍처의 프로토타이핑에 이상적입니다. 더 많은 벤치마킹 데이터셋은 Ultralytics 벤치마크 데이터셋 컬렉션을 참조하십시오.