跳转至内容

COCO8-多光谱数据集

简介

Ultralytics COCO8-Multispectral 数据集是原始 COCO8 数据集的高级变体,旨在促进多光谱目标检测模型的实验。它由 COCO train 2017 数据集中相同的 8 张图像组成——4 张用于训练,4 张用于验证——但每张图像都转换为 10 通道多光谱格式。通过扩展到标准 RGB 通道之外,COCO8-Multispectral 能够开发和评估可以利用更丰富的光谱信息的模型。

多光谱图像概述

COCO8-多光谱与 Ultralytics HUBYOLO11 完全兼容,确保无缝集成到您的计算机视觉工作流程中。



观看: 如何在多光谱数据集上训练 Ultralytics YOLO11 | Multi-Channel VisionAI 🚀

数据集生成

COCO8-Multispectral 中的多光谱图像是通过在可见光谱内 10 个均匀间隔的光谱通道上插值原始 RGB 图像而创建的。该过程包括:

  • 波长分配:将标称波长分配给 RGB 通道 - 红色:650 nm,绿色:510 nm,蓝色:475 nm。
  • 插值:使用线性插值来估计 450 nm 和 700 nm 之间中间波长的像素值,从而产生 10 个光谱通道。
  • 外推法: 使用 SciPy 的推断法 interp1d 该函数用于估计超出原始 RGB 波长的值,从而确保完整的光谱表示。

这种方法模拟了一种多光谱成像过程,为模型训练和评估提供了更多样化的数据集。有关多光谱成像的更多信息,请参阅 多光谱成像 Wikipedia 文章

数据集 YAML

COCO8-Multispectral 数据集使用 YAML 文件进行配置,该文件定义数据集路径、类名和基本元数据。您可以查看官方 coco8-multispectral.yaml 文件在 Ultralytics GitHub 仓库.

ultralytics/cfg/datasets/coco8-multispectral.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip

注意

准备您的 TIFF 图像,采用 (channel, height, width) 顺序并保存于 .tiff.tif 扩展名,用于 Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

用法

要在 COCO8-Multispectral 数据集上训练 YOLO11n 模型 100 个 epochs,图像大小为 640,请使用以下示例。有关完整的训练选项列表,请参阅 YOLO 训练文档

训练示例

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640

有关模型选择和最佳实践的更多详细信息,请浏览 Ultralytics YOLO 模型文档YOLO 模型训练技巧指南

Sample Images 和注释

以下是来自 COCO8-Multispectral 数据集的马赛克训练批次示例:

数据集样本图像

  • 马赛克图像: 此图像展示了一个训练批次,其中多个数据集图像使用 mosaic 数据增强 进行组合。Mosaic 数据增强增加了每个批次中对象和场景的多样性,帮助模型更好地泛化到各种对象大小、宽高比和背景。

此技术对于像 COCO8-Multispectral 这样的小型数据集尤其有价值,因为它最大限度地提高了每张图像的效用。

引用和致谢

如果您在研究或开发中使用 COCO 数据集,请引用以下论文:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

特别感谢 COCO 联盟计算机视觉社区 的持续贡献。

常见问题

Ultralytics COCO8-Multispectral 数据集用于什么?

Ultralytics COCO8-Multispectral 数据集专为快速测试和调试 多光谱目标检测 模型而设计。它仅包含 8 张图像(4 张用于训练,4 张用于验证),非常适合在扩展到更大的数据集之前,验证您的 YOLO 训练流程并确保一切按预期工作。如需更多数据集进行实验,请访问 Ultralytics 数据集目录

多光谱数据如何提高目标检测的性能?

多光谱数据提供了标准 RGB 之外的额外光谱信息,使模型能够根据波长反射率的细微差异来区分对象。这可以提高检测精度,尤其是在具有挑战性的场景中。了解更多关于多光谱成像及其在高级计算机视觉中的应用。

COCO8-Multispectral 是否与 Ultralytics HUB 和 YOLO 模型兼容?

是的,COCO8-Multispectral 完全兼容 Ultralytics HUB 和所有 YOLO 模型,包括最新的 YOLO11。这使您可以轻松地将数据集集成到您的训练和验证工作流程中。

在哪里可以找到更多关于数据增强技术的信息?

为了更深入地了解诸如 mosaic 之类的数据增强方法及其对模型性能的影响,请参阅YOLO 数据增强指南Ultralytics 博客上关于数据增强的文章

我可以使用 COCO8-Multispectral 进行基准测试或教育目的吗?

当然!COCO8-Multispectral 的小尺寸和多光谱特性使其成为基准测试、教育演示和新模型架构原型设计的理想选择。有关更多基准测试数据集,请参阅Ultralytics 基准数据集集合



📅 创建于 4 个月前 ✏️ 更新于 21 天前

评论