COCO8 - Conjunto de dados multiespectrais
Introdução
A Ultralytics COCO8-Multispectral é uma variante avançada do conjunto de dados COCO8 original, concebido para facilitar a experimentação com modelos de deteção de objectos multiespectrais. Consiste nas mesmas 8 imagens do conjunto COCO train 2017 - 4 para treino e 4 para validação - mas com cada imagem transformada num formato multiespectral de 10 canais. Ao expandir para além dos canais RGB padrão, o COCO8-Multispectral permite o desenvolvimento e a avaliação de modelos que podem aproveitar informações espectrais mais ricas.
O COCO8-Multispectral é totalmente compatível com o Ultralytics HUB e o YOLO11assegurando uma integração perfeita nos seus fluxos de trabalho de visão por computador.
Geração de conjuntos de dados
As imagens multiespectrais do COCO8-Multispectral foram criadas através da interpolação das imagens RGB originais em 10 canais espectrais uniformemente espaçados dentro do espetro visível. O processo inclui:
- Atribuição de comprimento de onda: Atribuição de comprimentos de onda nominais aos canais RGB - Vermelho: 650 nm, Verde: 510 nm, Azul: 475 nm.
- Interpolação: Utilização de interpolação linear para estimar os valores de pixel em comprimentos de onda intermédios entre 450 nm e 700 nm, resultando em 10 canais espectrais.
- Extrapolação: Aplicar a extrapolação com SciPy's
interp1d
para estimar valores para além dos comprimentos de onda RGB originais, assegurando uma representação espetral completa.
Esta abordagem simula um processo de imagiologia multiespectral, fornecendo um conjunto de dados mais diversificado para a formação e avaliação do modelo. Para mais informações sobre imagiologia multiespectral, consulte o artigo da Wikipedia sobre imagiologia multiespectral.
Conjunto de dados YAML
O conjunto de dados COCO8-Multispectral é configurado através de um ficheiro YAML, que define os caminhos do conjunto de dados, os nomes das classes e os metadados essenciais. Pode consultar o ficheiro oficial coco8-multispectral.yaml
no ficheiro Ultralytics Repositório GitHub.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
Nota
Prepare as suas imagens TIFF em (channel, height, width)
e guardado com .tiff
ou .tif
extensão para utilização com o Ultralytics:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inference
Utilização
Para treinar um modelo YOLO11n no conjunto de dados COCO8-Multispectral para 100 épocas com um tamanho de imagem de 640, utilize os seguintes exemplos. Para obter uma lista completa de opções de treinamento, consulte a documentação de treinamentoYOLO .
Exemplo de comboio
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640
Para obter mais detalhes sobre a seleção de modelos e as melhores práticas, explore a documentação do modeloUltralytics YOLO e o guia Dicas de formação do modeloYOLO .
Exemplos de imagens e anotações
Abaixo está um exemplo de um lote de treino em mosaico do conjunto de dados COCO8-Multispectral:
- Imagem em mosaico: Esta imagem demonstra um lote de treino em que várias imagens de conjuntos de dados são combinadas utilizando o aumento de mosaico. O aumento do mosaico aumenta a diversidade de objectos e cenas dentro de cada lote, ajudando o modelo a generalizar melhor para vários tamanhos de objectos, proporções e fundos.
Esta técnica é especialmente valiosa para pequenos conjuntos de dados como o COCO8-Multispectral, uma vez que maximiza a utilidade de cada imagem durante o treino.
Citações e agradecimentos
Se utilizar o conjunto de dados COCO na sua investigação ou desenvolvimento, cite o seguinte documento:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Agradecimentos especiais ao Consórcio COCO pelas suas contribuições contínuas para a comunidade da visão computacional.
FAQ
Para que é utilizado o conjunto de dados multiespectral COCO8 Ultralytics ?
O conjunto de dados Ultralytics COCO8-Multispectral foi concebido para testar e depurar rapidamente modelos de deteção de objectos multiespectrais. Com apenas 8 imagens (4 para treino, 4 para validação), é ideal para verificar o seu YOLO e garantir que tudo funciona como esperado antes de passar para conjuntos de dados maiores. Para obter mais conjuntos de dados para experimentar, visite o Catálogo de conjuntos de dadosUltralytics .
Como é que os dados multiespectrais melhoram a deteção de objectos?
Os dados multiespectrais fornecem informações espectrais adicionais para além do RGB padrão, permitindo que os modelos distingam objectos com base em diferenças subtis de reflectância entre comprimentos de onda. Isto pode aumentar a precisão da deteção, especialmente em cenários difíceis. Saiba mais sobre a imagem multiespectral e as suas aplicações na visão computacional avançada.
O COCO8-Multispectral é compatível com os modelos Ultralytics HUB e YOLO ?
Sim, o COCO8-Multispectral é totalmente compatível com o Ultralytics HUB e todos os modelosYOLO , incluindo o mais recente YOLO11. Isto permite-lhe integrar facilmente o conjunto de dados nos seus fluxos de trabalho de formação e validação.
Onde posso encontrar mais informações sobre técnicas de aumento de dados?
Para uma compreensão mais aprofundada dos métodos de aumento de dados, como o mosaico, e do seu impacto no desempenho do modelo, consulte o Guia de aumento de dadosYOLO e o BlogueUltralytics sobre aumento de dados.
Posso utilizar o COCO8-Multispectral para fins de avaliação comparativa ou educativos?
Sem dúvida! O tamanho pequeno e a natureza multiespectral do COCO8-Multispectral tornam-no ideal para benchmarking, demonstrações educacionais e protótipos de novas arquitecturas de modelos. Para obter mais conjuntos de dados de avaliação comparativa, consulte a coleção de conjuntos de dados de avaliação comparativaUltralytics .