Набор данных CIFAR-100

Набор данных CIFAR-100 (Канадский институт перспективных исследований) является значительным расширением набора данных CIFAR-10 и состоит из 60 000 цветных изображений размером 32x32, разделенных на 100 различных классов. Он был разработан исследователями из института CIFAR и представляет собой более сложный набор данных для решения продвинутых задач машинного обучения и компьютерного зрения.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Основные характеристики

  • Набор данных CIFAR-100 состоит из 60 000 изображений, разделенных на 100 классов.
  • Каждый класс содержит 600 изображений, разделенных на 500 для обучения и 100 для тестирования.
  • Изображения цветные и имеют размер 32x32 пикселя.
  • 100 различных классов сгруппированы в 20 укрупненных категорий для классификации более высокого уровня.
  • CIFAR-100 широко используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-100 разделен на два подмножества:

  1. Обучающий набор: это подмножество содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Приложения

Набор данных CIFAR-100 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его более сложным и комплексным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-100 в течение 100 эпох с размером изображения 32x32, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов можно найти на странице Обучение модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Примеры изображений и аннотаций

Набор данных CIFAR-100 содержит цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора данных:

Примеры изображений из набора данных для классификации CIFAR-100

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-100, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если ты используешь набор данных CIFAR-100 в своих исследованиях или разработках, пожалуйста, сошлись на следующую статью:

Цитата
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-100 в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-100 и его создателе посети веб-сайт набора данных CIFAR-100.

Часто задаваемые вопросы (FAQ)

Что такое набор данных CIFAR-100 и почему он значим?

Набор данных CIFAR-100 — это большая коллекция из 60 000 цветных изображений размером 32x32, классифицированных по 100 классам. Разработанный Канадским институтом перспективных исследований (CIFAR), он представляет собой сложный набор данных, идеально подходящий для решения комплексных задач машинного обучения и компьютерного зрения. Его значимость заключается в разнообразии классов и небольшом размере изображений, что делает его ценным ресурсом для обучения и тестирования моделей глубокого обучения, таких как сверточные нейронные сети (CNN), с использованием таких фреймворков, как Ultralytics YOLO.

Как обучить модель YOLO на наборе данных CIFAR-100?

Ты можешь обучить модель YOLO на наборе данных CIFAR-100, используя Python или команды CLI. Вот как это сделать:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Полный список доступных аргументов можно найти на странице Обучение модели.

Каковы основные области применения набора данных CIFAR-100?

Набор данных CIFAR-100 широко используется при обучении и оценке моделей глубокого обучения для классификации изображений. Его разнообразный набор из 100 классов, сгруппированных в 20 укрупненных категорий, обеспечивает сложную среду для тестирования таких алгоритмов, как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие подходы машинного обучения. Этот набор данных является ключевым ресурсом в исследованиях и разработках в области машинного обучения и компьютерного зрения, особенно для задач распознавания объектов и классификации.

Как структурирован набор данных CIFAR-100?

Набор данных CIFAR-100 разделен на два основных подмножества:

  1. Обучающий набор: содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: состоит из 10 000 изображений, используемых для тестирования и бенчмаркинга обученных моделей.

Каждый из 100 классов содержит 600 изображений, из которых 500 предназначены для обучения, а 100 — для тестирования, что делает его уникально подходящим для серьезных академических и промышленных исследований.

Где я могу найти примеры изображений и аннотации из набора данных CIFAR-100?

Набор данных CIFAR-100 включает разнообразные цветные изображения объектов, что делает его структурированным набором данных для задач классификации изображений. Ты можешь обратиться к странице документации, чтобы увидеть примеры изображений и аннотации. Эти примеры подчеркивают разнообразие и сложность набора данных, что важно для обучения надежных моделей классификации изображений. Чтобы ознакомиться с другими наборами данных, подходящими для задач классификации, посети обзор наборов данных для классификации от Ultralytics.

Комментарии