Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных COCO8-Multispectral#

Link to this sectionВведение#

Набор данных Ultralytics COCO8-Multispectral — это усовершенствованный вариант оригинального набора данных COCO8, разработанный для упрощения экспериментов с мультиспектральными моделями обнаружения объектов. Он состоит из тех же 8 изображений из набора COCO train 2017 — 4 для обучения и 4 для валидации, — но каждое изображение преобразовано в 10-канальный мультиспектральный формат. Выходя за рамки стандартных RGB-каналов, COCO8-Multispectral позволяет разрабатывать и оценивать модели, которые могут использовать более богатую спектральную информацию.

Multispectral imaging for object detection

COCO8-Multispectral полностью совместим с Ultralytics Platform и YOLO26, что обеспечивает бесшовную интеграцию в твои рабочие процессы компьютерного зрения.



Watch: How to Train Ultralytics YOLO26 on Multispectral Datasets | Multi-Channel VisionAI 🚀

Link to this sectionГенерация набора данных#

Мультиспектральные изображения в COCO8-Multispectral были созданы путем интерполяции исходных RGB-изображений по 10 равномерно распределенным спектральным каналам в видимом спектре. Процесс включает:

  • Назначение длины волны: Присвоение номинальных длин волн RGB-каналам — Красный: 650 нм, Зеленый: 510 нм, Синий: 475 нм.
  • Интерполяция: Использование линейной интерполяции для оценки значений пикселей на промежуточных длинах волн от 450 нм до 700 нм, в результате чего получается 10 спектральных каналов.
  • Экстраполяция: Применение экстраполяции с помощью функции interp1d из SciPy для оценки значений за пределами исходных RGB-волн, что обеспечивает полное спектральное представление.

Этот подход имитирует процесс мультиспектральной визуализации, предоставляя более разнообразный набор данных для обучения и оценки моделей. Для дальнейшего изучения мультиспектральной визуализации см. статью о мультиспектральной визуализации в Википедии.

Link to this sectionYAML набора данных#

Набор данных COCO8-Multispectral настраивается с помощью файла YAML, который определяет пути к данным, имена классов и важные метаданные. Ты можешь просмотреть официальный файл coco8-multispectral.yaml в репозитории Ultralytics на GitHub.

ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-multispectral ← downloads here (20.2 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Number of multispectral image channels
channels: 10

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
Примечание

Подготовь свои TIFF-изображения в порядке (channel, height, width), сохранив их с расширением .tiff или .tif, и убедись, что они представлены в формате uint8 для использования с Ultralytics:

import cv2
import numpy as np

# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8)  # CHW-order
cv2.imwritemulti("example.tiff", image)

# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape)  # (640, 640, 10)  HWC-order for training and inference

Link to this sectionИспользование#

Чтобы обучить модель YOLO26n на наборе данных COCO8-Multispectral в течение 100 эпох с размером изображения 640, используй следующие примеры. Полный список параметров обучения см. в документации по обучению YOLO.

Пример обучения
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)

Для получения подробной информации о выборе моделей и лучших практиках изучи документацию по моделям Ultralytics YOLO и руководство по советам по обучению моделей YOLO.

Link to this sectionПримеры изображений и аннотаций#

Ниже представлен пример мозаичного тренировочного батча из набора данных COCO8-Multispectral:

COCO8 multispectral dataset mosaic training batch
  • Мозаичное изображение: Это изображение демонстрирует тренировочный батч, где несколько изображений из набора данных объединены с помощью мозаичной аугментации. Мозаичная аугментация увеличивает разнообразие объектов и сцен в каждом батче, помогая модели лучше обобщать данные для различных размеров объектов, соотношений сторон и фонов.

Этот метод особенно ценен для небольших наборов данных, таких как COCO8-Multispectral, поскольку он максимизирует полезность каждого изображения во время обучения.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных COCO в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:

Цитата
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Особая благодарность COCO Consortium за их постоянный вклад в сообщество компьютерного зрения.

Link to this sectionЧасто задаваемые вопросы (FAQ)#

Link to this sectionДля чего используется набор данных Ultralytics COCO8-Multispectral?#

Набор данных Ultralytics COCO8-Multispectral предназначен для быстрого тестирования и отладки моделей мультиспектрального обнаружения объектов. Имея всего 8 изображений (4 для обучения, 4 для валидации), он идеально подходит для проверки твоих конвейеров обучения YOLO26 и подтверждения того, что все работает как ожидалось, прежде чем переходить к более крупным наборам данных. Чтобы найти другие наборы данных для экспериментов, посети каталог наборов данных Ultralytics.

Link to this sectionКак мультиспектральные данные улучшают обнаружение объектов?#

Мультиспектральные данные предоставляют дополнительную спектральную информацию помимо стандартного RGB, что позволяет моделям различать объекты на основе тонких различий в отражательной способности на разных длинах волн. Это может повысить точность обнаружения, особенно в сложных сценариях. Узнай больше о мультиспектральной визуализации и ее применениях в продвинутом компьютерном зрении.

Link to this sectionСовместим ли COCO8-Multispectral с Ultralytics Platform и моделями YOLO?#

Да, COCO8-Multispectral полностью совместим с Ultralytics Platform и всеми моделями YOLO, включая последнюю YOLO26. Это позволяет легко интегрировать набор данных в твои рабочие процессы обучения и валидации.

Link to this sectionГде я могу найти больше информации о методах аугментации данных?#

Для более глубокого понимания методов аугментации данных, таких как мозаика, и их влияния на производительность модели, обратись к Руководству по аугментации данных YOLO и блогу Ultralytics об аугментации данных.

Link to this sectionМогу ли я использовать COCO8-Multispectral для бенчмаркинга или в образовательных целях?#

Безусловно! Небольшой размер и мультиспектральный характер COCO8-Multispectral делают его идеальным для бенчмаркинга, образовательных демонстраций и прототипирования новых архитектур моделей. Для получения дополнительных наборов данных для тестирования см. Коллекцию наборов данных для бенчмаркинга Ultralytics.

Комментарии