Link to this sectionНабор данных COCO8-Multispectral#
Link to this sectionВведение#
Набор данных Ultralytics COCO8-Multispectral — это усовершенствованный вариант оригинального набора данных COCO8, разработанный для упрощения экспериментов с мультиспектральными моделями обнаружения объектов. Он состоит из тех же 8 изображений из набора COCO train 2017 — 4 для обучения и 4 для валидации, — но каждое изображение преобразовано в 10-канальный мультиспектральный формат. Выходя за рамки стандартных RGB-каналов, COCO8-Multispectral позволяет разрабатывать и оценивать модели, которые могут использовать более богатую спектральную информацию.
COCO8-Multispectral полностью совместим с Ultralytics Platform и YOLO26, что обеспечивает бесшовную интеграцию в твои рабочие процессы компьютерного зрения.
Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀
Link to this sectionГенерация набора данных#
Мультиспектральные изображения в COCO8-Multispectral были созданы путем интерполяции исходных RGB-изображений по 10 равномерно распределенным спектральным каналам в видимом спектре. Процесс включает:
- Назначение длины волны: Присвоение номинальных длин волн RGB-каналам — Красный: 650 нм, Зеленый: 510 нм, Синий: 475 нм.
- Интерполяция: Использование линейной интерполяции для оценки значений пикселей на промежуточных длинах волн от 450 нм до 700 нм, в результате чего получается 10 спектральных каналов.
- Экстраполяция: Применение экстраполяции с помощью функции
interp1dиз SciPy для оценки значений за пределами исходных RGB-волн, что обеспечивает полное спектральное представление.
Этот подход имитирует процесс мультиспектральной визуализации, предоставляя более разнообразный набор данных для обучения и оценки моделей. Для дальнейшего изучения мультиспектральной визуализации см. статью о мультиспектральной визуализации в Википедии.
Link to this sectionYAML набора данных#
Набор данных COCO8-Multispectral настраивается с помощью файла YAML, который определяет пути к данным, имена классов и важные метаданные. Ты можешь просмотреть официальный файл coco8-multispectral.yaml в репозитории Ultralytics на GitHub.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zipПодготовь свои TIFF-изображения в порядке (channel, height, width), сохранив их с расширением .tiff или .tif, и убедись, что они представлены в формате uint8 для использования с Ultralytics:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inferenceLink to this sectionИспользование#
Чтобы обучить модель YOLO26n на наборе данных COCO8-Multispectral в течение 100 эпох с размером изображения 640, используй следующие примеры. Полный список параметров обучения см. в документации по обучению YOLO.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)Для получения подробной информации о выборе моделей и лучших практиках изучи документацию по моделям Ultralytics YOLO и руководство по советам по обучению моделей YOLO.
Link to this sectionПримеры изображений и аннотаций#
Ниже представлен пример мозаичного тренировочного батча из набора данных COCO8-Multispectral:
- Мозаичное изображение: Это изображение демонстрирует тренировочный батч, где несколько изображений из набора данных объединены с помощью мозаичной аугментации. Мозаичная аугментация увеличивает разнообразие объектов и сцен в каждом батче, помогая модели лучше обобщать данные для различных размеров объектов, соотношений сторон и фонов.
Этот метод особенно ценен для небольших наборов данных, таких как COCO8-Multispectral, поскольку он максимизирует полезность каждого изображения во время обучения.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных COCO в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}Особая благодарность COCO Consortium за их постоянный вклад в сообщество компьютерного зрения.
Link to this sectionЧасто задаваемые вопросы (FAQ)#
Link to this sectionДля чего используется набор данных Ultralytics COCO8-Multispectral?#
Набор данных Ultralytics COCO8-Multispectral предназначен для быстрого тестирования и отладки моделей мультиспектрального обнаружения объектов. Имея всего 8 изображений (4 для обучения, 4 для валидации), он идеально подходит для проверки твоих конвейеров обучения YOLO26 и подтверждения того, что все работает как ожидалось, прежде чем переходить к более крупным наборам данных. Чтобы найти другие наборы данных для экспериментов, посети каталог наборов данных Ultralytics.
Link to this sectionКак мультиспектральные данные улучшают обнаружение объектов?#
Мультиспектральные данные предоставляют дополнительную спектральную информацию помимо стандартного RGB, что позволяет моделям различать объекты на основе тонких различий в отражательной способности на разных длинах волн. Это может повысить точность обнаружения, особенно в сложных сценариях. Узнай больше о мультиспектральной визуализации и ее применениях в продвинутом компьютерном зрении.
Link to this sectionСовместим ли COCO8-Multispectral с Ultralytics Platform и моделями YOLO?#
Да, COCO8-Multispectral полностью совместим с Ultralytics Platform и всеми моделями YOLO, включая последнюю YOLO26. Это позволяет легко интегрировать набор данных в твои рабочие процессы обучения и валидации.
Link to this sectionГде я могу найти больше информации о методах аугментации данных?#
Для более глубокого понимания методов аугментации данных, таких как мозаика, и их влияния на производительность модели, обратись к Руководству по аугментации данных YOLO и блогу Ultralytics об аугментации данных.
Link to this sectionМогу ли я использовать COCO8-Multispectral для бенчмаркинга или в образовательных целях?#
Безусловно! Небольшой размер и мультиспектральный характер COCO8-Multispectral делают его идеальным для бенчмаркинга, образовательных демонстраций и прототипирования новых архитектур моделей. Для получения дополнительных наборов данных для тестирования см. Коллекцию наборов данных для бенчмаркинга Ultralytics.