Перейти к содержимому

Набор данных CIFAR-100

Набор данных CIFAR-100 (Canadian Institute For Advanced Research) - это значительное расширение набора данных CIFAR-10, состоящего из 60 000 цветных изображений 32х32 в 100 различных классах. Он был разработан исследователями из института CIFAR и предлагает более сложный набор данных для решения более сложных задач машинного обучения и компьютерного зрения.

Основные характеристики

  • Набор данных CIFAR-100 состоит из 60 000 изображений, разделенных на 100 классов.
  • Каждый класс содержит 600 изображений, разделенных на 500 для обучения и 100 для тестирования.
  • Изображения цветные и имеют размер 32х32 пикселя.
  • 100 различных классов сгруппированы в 20 грубых категорий для классификации более высокого уровня.
  • CIFAR-100 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-100 разбит на два подмножества:

  1. Набор для обучения: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Набор для тестирования: Это подмножество состоит из 10 000 изображений, которые используются для тестирования и бенчмаркинга обученных моделей.

Приложения

Набор данных CIFAR-100 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его более сложным и всеобъемлющим набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-100 в течение 100 эпох с размером изображения 32x32, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Примеры изображений и аннотаций

Набор данных CIFAR-100 содержит цветные изображения различных объектов, представляя собой хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-100, подчеркивая важность разнообразных наборов данных для обучения надежных моделей классификации изображений.

Цитаты и благодарности

Если ты используешь набор данных CIFAR-100 в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы выразить благодарность Алексу Крижевскому за создание и поддержку набора данных CIFAR-100 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Чтобы узнать больше о наборе данных CIFAR-100 и его создателе, посети сайт CIFAR-100 dataset.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Комментарии