COCO8-Multispectral 데이터 세트
소개
Ultralytics COCO8-Multispectral 데이터 세트는 멀티스펙트럼 객체 탐지 모델을 사용한 실험을 용이하게 하도록 설계된 원본 COCO8 데이터 세트의 고급 변형입니다. COCO train 2017 세트의 동일한 8개 이미지(학습용 4개, 유효성 검사용 4개)로 구성되지만 각 이미지는 10채널 멀티스펙트럼 형식으로 변환됩니다. 표준 RGB 채널을 넘어 확장함으로써 COCO8-Multispectral은 더 풍부한 스펙트럼 정보를 활용할 수 있는 모델의 개발 및 평가를 가능하게 합니다.
COCO8-Multispectral은 Ultralytics HUB 및 YOLO11과 완벽하게 호환되므로 컴퓨터 비전 워크플로에 원활하게 통합할 수 있습니다.
참고: Ultralytics YOLO11을 다중 스펙트럼 데이터 세트에서 훈련하는 방법 | Multi-Channel VisionAI 🚀
데이터 세트 생성
COCO8-Multispectral의 다중 스펙트럼 이미지는 가시 스펙트럼 내에서 10개의 균등하게 간격을 둔 스펙트럼 채널에 걸쳐 원래 RGB 이미지를 보간하여 생성되었습니다. 이 프로세스에는 다음이 포함됩니다.
- 파장 할당: RGB 채널에 공칭 파장 할당—Red: 650 nm, Green: 510 nm, Blue: 475 nm.
- 보간: 450nm와 700nm 사이의 중간 파장에서 픽셀 값을 추정하기 위해 선형 보간법을 사용하여 10개의 스펙트럼 채널을 생성합니다.
- 외삽: SciPy의 외사법을 적용하여
interp1d
원래 RGB 파장 이상의 값을 추정하여 완전한 스펙트럼 표현을 보장하는 함수입니다.
이 접근 방식은 다중 스펙트럼 이미징 프로세스를 시뮬레이션하여 모델 학습 및 평가를 위한 보다 다양한 데이터 세트를 제공합니다. 다중 스펙트럼 이미징에 대한 자세한 내용은 다중 스펙트럼 이미징 Wikipedia 기사를 참조하십시오.
데이터세트 YAML
COCO8-Multispectral 데이터 세트는 YAML 파일을 사용하여 구성되며, 여기에는 데이터 세트 경로, 클래스 이름 및 필수 메타데이터가 정의되어 있습니다. 공식 파일을 검토할 수 있습니다. coco8-multispectral.yaml
파일을 Ultralytics GitHub 저장소.
ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
참고
다음에 TIFF 이미지를 준비하십시오. (channel, height, width)
순서대로 정렬하고 저장합니다. .tiff
또는 .tif
Ultralytics와 함께 사용할 확장:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inference
사용법
이미지 크기가 640인 COCO8-Multispectral 데이터 세트에서 YOLO11n 모델을 100 에포크 동안 훈련하려면 다음 예제를 사용하세요. 포괄적인 훈련 옵션 목록은 YOLO 훈련 문서를 참조하세요.
훈련 예제
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640
모델 선택 및 모범 사례에 대한 자세한 내용은 Ultralytics YOLO 모델 문서 및 YOLO 모델 훈련 팁 가이드를 참조하십시오.
샘플 이미지 및 주석
다음은 COCO8-Multispectral 데이터 세트에서 모자이크된 훈련 배치 예시입니다.
- 모자이크 이미지: 이 이미지는 모자이크 증강을 사용하여 여러 데이터 세트 이미지를 결합한 훈련 배치를 보여줍니다. 모자이크 증강은 각 배치 내에서 객체와 장면의 다양성을 증가시켜 모델이 다양한 객체 크기, 종횡비 및 배경에 더 잘 일반화되도록 돕습니다.
이 기술은 COCO8-Multispectral과 같은 작은 데이터 세트에서 특히 유용하며, 학습 중에 각 이미지의 유용성을 극대화합니다.
인용 및 감사의 말씀
연구 또는 개발에 COCO 데이터 세트를 사용하는 경우 다음 논문을 인용해 주십시오.
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
컴퓨터 비전 컨소시엄(COCO Consortium)의 컴퓨터 비전 커뮤니티에 대한 지속적인 기여에 특별히 감사드립니다.
FAQ
Ultralytics COCO8-Multispectral 데이터 세트는 무엇에 사용됩니까?
Ultralytics COCO8-Multispectral 데이터 세트는 멀티스펙트럼 객체 감지 모델의 빠른 테스트 및 디버깅을 위해 설계되었습니다. 8개의 이미지(학습용 4개, 검증용 4개)만으로 구성되어 있어, 더 큰 데이터 세트로 확장하기 전에 YOLO 학습 파이프라인을 검증하는 데 이상적입니다. 실험해 볼 더 많은 데이터 세트를 보려면 Ultralytics 데이터 세트 카탈로그를 방문하십시오.
다중 스펙트럼 데이터는 객체 탐지를 어떻게 향상시키나요?
멀티스펙트럴 데이터는 표준 RGB를 넘어 추가적인 스펙트럼 정보를 제공하여 모델이 파장에 따른 반사율의 미묘한 차이를 기반으로 객체를 구별할 수 있도록 합니다. 이는 특히 까다로운 시나리오에서 검출 정확도를 향상시킬 수 있습니다. 멀티스펙트럴 이미징 및 고급 컴퓨터 비전에서의 응용 분야에 대해 자세히 알아보세요.
COCO8-Multispectral은 Ultralytics HUB 및 YOLO 모델과 호환됩니까?
예, COCO8-Multispectral은 최신 YOLO11을 포함한 모든 YOLO 모델과 Ultralytics HUB와 완벽하게 호환됩니다. 따라서 데이터 세트를 트레이닝 및 검증 워크플로에 쉽게 통합할 수 있습니다.
데이터 증강 기술에 대한 자세한 정보는 어디에서 찾을 수 있나요?
모자이크와 같은 데이터 증강 방법과 이것이 모델 성능에 미치는 영향에 대한 더 자세한 내용은 YOLO 데이터 증강 가이드 및 Ultralytics 블로그의 데이터 증강 관련 내용을 참조하십시오.
벤치마킹 또는 교육 목적으로 COCO8-Multispectral을 사용할 수 있습니까?
물론입니다! COCO8-Multispectral의 작은 크기와 다중 스펙트럼 특성은 벤치마킹, 교육 데모 및 새로운 모델 아키텍처 프로토타입 제작에 이상적입니다. 더 많은 벤치마킹 데이터 세트는 Ultralytics 벤치마크 데이터 세트 컬렉션을 참조하십시오.