COCO8 多光谱数据集
导言
超数据分析 UltralyticsCOCO8 多光谱数据集是原始 COCO8 数据集的高级变体,旨在促进多光谱物体检测模型的实验。它由 COCO train 2017 数据集中的 8 幅相同图像组成,其中 4 幅用于训练,4 幅用于验证,但每幅图像都转换成了 10 通道多光谱格式。COCO8-Multispectral 扩展到标准 RGB 通道之外,从而能够开发和评估可利用更丰富光谱信息的模型。
Ultralytics 与Ultralytics HUB和 YOLO11完全兼容,确保无缝集成到您的计算机视觉工作流程中。
数据集生成
COCO8-Multispectral 中的多光谱图像是通过对可见光谱内 10 个均匀分布的光谱通道中的原始 RGB 图像进行插值而生成的。这一过程包括
- 波长分配:为 RGB 通道分配标称波长--红色:650 nm,绿色:510 nm,蓝色:475 nm:510 nm,蓝色:475 nm。
- 内插法使用线性插值法估算 450 纳米到 700 纳米中间波长的像素值,得到 10 个光谱通道。
- 外推法:使用 SciPy 的外推法
interp1d
函数来估算原始 RGB 波长以外的值,从而确保完整的光谱表示。
这种方法模拟了多光谱成像过程,为模型训练和评估提供了更多样化的数据集。有关多光谱成像的更多信息,请参阅多光谱成像维基百科文章。
数据集 YAML
COCO8 多光谱数据集使用 YAML 文件进行配置,该文件定义了数据集路径、类名和基本元数据。您可以查看官方的 coco8-multispectral.yaml
文件中的 Ultralytics GitHub 存储库.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
备注
在 (channel, height, width)
并以 .tiff
或 .tif
与Ultralytics 一起使用的扩展:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inference
使用方法
要在 COCO8-Multispectral 数据集上对 YOLO11n 模型进行 100 个历元(图像大小为 640)的训练,请使用以下示例。有关训练选项的完整列表,请参阅YOLO 训练文档。
列车示例
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640
有关模型选择和最佳实践的更多详情,请浏览Ultralytics YOLO 模型文档和YOLO 模型培训技巧指南。
图片和注释示例
下面是 COCO8 多光谱数据集的一个镶嵌训练批次示例:
- 马赛克图像:该图像展示了使用马赛克增强技术将多个数据集图像组合在一起的训练批次。马赛克增强增加了每个批次中物体和场景的多样性,有助于模型更好地泛化到各种物体尺寸、长宽比和背景中。
这种技术对于 COCO8-Multispectral 这样的小型数据集尤为重要,因为它能在训练过程中最大限度地利用每幅图像。
引文和致谢
如果您在研究或开发中使用 COCO 数据集,请引用以下论文:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
常见问题
Ultralytics COCO8 多光谱数据集的用途是什么?
Ultralytics COCO8 多光谱数据集是专为快速测试和调试多光谱物体检测模型而设计的。该数据集只有 8 幅图像(4 幅用于训练,4 幅用于验证),非常适合用于验证您的 YOLO训练管道,并确保在扩展到更大的数据集之前一切工作符合预期的理想选择。如需了解更多实验数据集,请访问Ultralytics 数据集目录。
多光谱数据如何改进物体探测?
多光谱数据可提供标准 RGB 以外的额外光谱信息,使模型能够根据不同波长反射率的细微差别来区分物体。这可以提高检测精度,尤其是在具有挑战性的场景中。进一步了解多光谱成像及其在高级计算机视觉中的应用。
COCO8 多光谱仪是否与Ultralytics HUB 和YOLO 型号兼容?
是的,COCO8-多光谱与Ultralytics HUB和所有YOLO 模型(包括最新的YOLO11)完全兼容。这样,您就可以轻松地将数据集集成到您的训练和验证工作流程中。
在哪里可以找到有关数据增强技术的更多信息?
要深入了解马赛克等数据扩充方法及其对模型性能的影响,请参阅《YOLO 数据扩充指南》和Ultralytics 数据扩充博客。
我可以将 COCO8-Multispectral 用于基准测试或教育目的吗?
完全正确!COCO8-Multispectral 的小尺寸和多光谱特性使其成为基准测试、教学演示和新模型架构原型开发的理想之选。如需了解更多基准数据集,请参阅Ultralytics 基准数据集系列。