No license

Link to this sectionНабор данных CIFAR-100#

Набор данных CIFAR-100 (Канадский институт перспективных исследований) — это эталон классификации изображений, состоящий из 60 000 цветных изображений размером 32x32, равномерно распределенных по 100 детализированным классам (по 600 изображений в каждом), которые, в свою очередь, объединены в 20 укрупненных суперклассов. Созданный Алексом Крижевским, он поставляется с предопределенным разделением на 50 000 обучающих и 10 000 тестовых изображений, что делает его более сложным и детализированным аналогом набора данных CIFAR-10.

Watch: How to Train an Image Classification Model on CIFAR-100 using Ultralytics YOLO

Link to this sectionКлючевые особенности#

CIFAR-100 содержит 60 000 цветных изображений размером 32x32 пикселя, равномерно распределенных по 100 классам.
Каждый класс содержит ровно 600 изображений — 500 для обучения и 100 для тестирования, поэтому набор данных идеально сбалансирован.
100 детализированных классов объединены в 20 укрупненных суперклассов для классификации более высокого уровня.
Набор данных поставляется с предустановленным разделением на обучающую и тестовую выборки, поэтому ручное или автоматическое разделение не требуется.
CIFAR-100 является стандартным эталоном для исследований в области детализированной классификации изображений и распознавания объектов.

Link to this sectionСтруктура набора данных#

CIFAR-100 поставляется с официальным предопределенным разделением, поэтому автоматическое или ручное разбиение не требуется:

Классы: 100 детализированных классов, объединенных в 20 укрупненных суперклассов
Всего изображений: 60 000 (32x32 цветных)
Обучающий набор: 50 000 изображений (500 на класс)
Тестовый набор: 10 000 изображений (100 на класс)

Валидационная выборка

У CIFAR-100 нет отдельной папки для валидации, поэтому Ultralytics по умолчанию использует тестовый набор из 10 000 изображений в качестве валидационного при обучении. Обучение с параметром data="cifar100" использует 100 детализированных классов.

Link to this sectionПрименение#

CIFAR-100 широко используется для обучения и оценки моделей классификации изображений, от классических сверточных нейронных сетей (CNN) и методов опорных векторов (SVM) до современных глубоких архитектур. Его 100 детализированных классов и небольшой размер изображений делают его требовательным эталоном для исследований в области машинного обучения, сравнения алгоритмов и экспериментов с компьютерным зрением.

Link to this sectionИспользование#

Обучи модель YOLO на CIFAR-100 в течение 100 эпох с размером изображения 32. Полный список доступных аргументов смотри на странице Обучение и в руководстве по задаче классификации изображений.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionПримеры изображений и аннотации#

Примеры изображений из набора данных CIFAR-100:

Примеры набора данных для классификации изображений CIFAR-100

Эти примеры демонстрируют разнообразие объектов в наборе данных CIFAR-100, подчеркивая ценность разнообразного набора данных для обучения надежных моделей классификации изображений.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных CIFAR-100 в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-100 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Дополнительную информацию о наборе данных CIFAR-100 и его создателе ищи на сайте набора данных CIFAR-100.

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных CIFAR-100 в машинном обучении?#

Набор данных CIFAR-100 широко используется для обучения и тестирования моделей детализированной классификации изображений и распознавания объектов. Он содержит 60 000 цветных изображений размером 32x32, распределенных по 100 классам, сгруппированным в 20 суперклассов, что делает его более сложным эталоном, чем CIFAR-10, для таких алгоритмов, как сверточные нейронные сети (CNN) и методы опорных векторов (SVM), а также для оценки моделей глубинного обучения, созданных с помощью Ultralytics YOLO.

Link to this sectionКак обучить модель Ultralytics YOLO на наборе данных CIFAR-100?#

Чтобы обучить модель Ultralytics YOLO на CIFAR-100, используй приведенные ниже фрагменты кода. Набор данных загружается автоматически при первом использовании. Полный список аргументов смотри на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionСколько классов в наборе данных CIFAR-100?#

CIFAR-100 содержит 100 детализированных классов — например, яблоко, дельфин, клен, мотоцикл и ракета — по 600 изображений в каждом, всего 60 000 изображений. Эти 100 классов дополнительно объединены в 20 укрупненных суперклассов (например, суперкласс «деревья» включает клен, дуб, пальму, сосну и иву). Обучение с параметром data="cifar100" использует 100 детализированных классов.

Link to this sectionКак набор данных CIFAR-100 разделен на обучающий и тестовый наборы?#

CIFAR-100 поставляется с предопределенным разделением на 50 000 обучающих и 10 000 тестовых изображений, по 500 обучающих и 100 тестовых изображений на класс. В отличие от наборов данных для классификации на основе папок, которые Ultralytics разбивает автоматически, официальное разделение CIFAR-100 используется как есть, а тестовый набор по умолчанию служит валидационным при обучении.

Link to this sectionМогу ли я использовать Ultralytics Platform для обучения моделей на наборе данных CIFAR-100?#

Да. Ultralytics Platform позволяет управлять наборами данных, обучать модели классификации изображений и развертывать их без глубокого программирования. Это удобный способ запускать эксперименты с CIFAR-100 в облаке, а подробнее о других возможностях можно узнать в нашем обзоре наборов данных для классификации.

Участники

GLglenn-jocher¹⁵ RAraimbekovm² RIRizwanMunawar² MAMatthewNoyce¹ JKjk4e¹

Создано 12 нояб. 2023 г.Обновлено 3 дня назад