No license

Link to this sectionНабор данных CIFAR-10#

Набор данных CIFAR-10 (Канадский институт перспективных исследований) — это классический эталон для классификации изображений, состоящий из 60 000 цветных изображений размером 32x32 пикселя, равномерно распределенных по 10 классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик. Он поставляется с предопределенным разделением на 50 000 тренировочных и 10 000 тестовых изображений (по 6 000 на класс), что делает его легкой и хорошо сбалансированной отправной точкой для обучения и тестирования моделей классификации. Для более детальной задачи ознакомься с похожим набором данных CIFAR-100.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionКлючевые особенности#

CIFAR-10 содержит 60 000 цветных изображений размером 32x32 пикселя, равномерно распределенных по 10 классам.
Каждый класс содержит ровно 6 000 изображений — 5 000 для обучения и 1 000 для тестирования, поэтому набор данных идеально сбалансирован.
В наборе 10 классов: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик.
Набор данных поставляется с предустановленным разделением на обучающую и тестовую выборки, поэтому ручное или автоматическое разделение не требуется.
CIFAR-10 — это стандартный эталон для исследований в области классификации изображений и распознавания объектов.

Link to this sectionСтруктура набора данных#

CIFAR-10 поставляется с официальным, предопределенным разделением, поэтому автоматическое или ручное разбиение не требуется:

Классы: 10 (самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль, грузовик)
Всего изображений: 60 000 (32x32 цветных)
Тренировочный набор: 50 000 изображений (5 000 на класс)
Тестовый набор: 10 000 изображений (1 000 на класс)

Валидационная выборка

В CIFAR-10 нет отдельной папки валидации, поэтому Ultralytics по умолчанию использует тестовый набор из 10 000 изображений в качестве валидационной выборки во время обучения.

Link to this sectionПрименение#

CIFAR-10 широко используется для обучения и оценки моделей классификации изображений, от классических сверточных нейронных сетей (CNN) и методов опорных векторов (SVM) до современных глубоких архитектур. Небольшой размер изображений и сбалансированные классы делают его идеальным для быстрых экспериментов, бенчмаркинга новых алгоритмов и обучения основам компьютерного зрения.

Link to this sectionИспользование#

Обучи модель YOLO на CIFAR-10 в течение 100 эпох при размере изображения 32. Полный список доступных аргументов можно найти на странице Обучение и в руководстве по задаче классификации изображений.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionПримеры изображений и аннотации#

Набор данных CIFAR-10 содержит цветные изображения различных объектов, представляя собой хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Примеры набора данных классификации изображений CIFAR-10

Примеры демонстрируют разнообразие объектов в наборе данных CIFAR-10, подчеркивая ценность разнообразного набора данных для обучения надежных моделей классификации изображений.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных CIFAR-10 в своей исследовательской или проектной работе, пожалуйста, сошлись на следующую статью:

Цитата

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-10 и его создателе посети сайт набора данных CIFAR-10.

Link to this sectionFAQ#

Link to this sectionДля чего используется набор данных CIFAR-10 в машинном обучении?#

Набор данных CIFAR-10 широко используется для обучения и тестирования моделей классификации изображений и распознавания объектов. Он содержит 60 000 цветных изображений размером 32x32 пикселя, равномерно распределенных по 10 классам, а его малый размер и сбалансированность делают его быстрым и надежным эталоном для таких алгоритмов, как сверточные нейронные сети (CNN) и методы опорных векторов (SVM).

Link to this sectionКак мне обучить модель Ultralytics YOLO на наборе данных CIFAR-10?#

Чтобы обучить модель Ultralytics YOLO на CIFAR-10, используй приведенные ниже фрагменты кода. Набор данных загружается автоматически при первом использовании. Полный список аргументов смотри на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionСколько классов в наборе данных CIFAR-10?#

В CIFAR-10 10 классов — самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик — по 6 000 изображений в каждом, всего 60 000 изображений. Классы являются взаимоисключающими и идеально сбалансированными, без пересечений между категориями.

Link to this sectionКак набор данных CIFAR-10 разделен на обучающую и тестовую выборки?#

CIFAR-10 поставляется с предопределенным разделением на 50 000 тренировочных и 10 000 тестовых изображений, по 5 000 тренировочных и 1 000 тестовых изображений на класс. В отличие от наборов данных для классификации на основе папок, которые Ultralytics разделяет автоматически, официальное разбиение CIFAR-10 используется как есть, а тестовый набор по умолчанию служит валидационной выборкой во время обучения.

Link to this sectionМогу ли я использовать Ultralytics Platform для обучения моделей на наборе данных CIFAR-10?#

Да. Ultralytics Platform позволяет управлять наборами данных, обучать модели классификации изображений и развертывать их без сложного программирования. Это удобный способ проведения экспериментов с CIFAR-10 в облаке, а дополнительные варианты можно изучить в нашем обзоре наборов данных для классификации.

Участники

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Создано 12 нояб. 2023 г.Обновлено 3 дня назад