Перейти к содержимому

Набор данных CIFAR-10

Набор данных CIFAR-10 (Canadian Institute For Advanced Research) - это коллекция изображений, широко используемая для алгоритмов машинного обучения и компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений 32х32 в 10 различных классах.

Основные характеристики

  • Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
  • Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
  • Изображения цветные и имеют размер 32х32 пикселя.
  • В 10 различных классах представлены самолеты, машины, птицы, кошки, олени, собаки, лягушки, лошади, корабли и грузовики.
  • CIFAR-10 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-10 разбит на два подмножества:

  1. Набор для обучения: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Набор для тестирования: Это подмножество состоит из 10 000 изображений, которые используются для тестирования и бенчмаркинга обученных моделей.

Приложения

Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие датасета с точки зрения классов и наличие цветных изображений делают его хорошо оснащенным датасетом для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-10 в течение 100 эпох с размером изображения 32x32, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов можно найти на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Примеры изображений и аннотаций

Набор данных CIFAR-10 содержит цветные изображения различных объектов, представляя собой хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразных наборов данных для обучения надежных моделей классификации изображений.

Цитаты и благодарности

Если ты используешь набор данных CIFAR-10 в своих исследованиях или разработках, пожалуйста, ссылайся на следующую статью:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы выразить благодарность Алексу Крижевскому за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Чтобы узнать больше о наборе данных CIFAR-10 и его создателе, посети сайт CIFAR-10 dataset.



Создано 2023-11-12, Обновлено 2023-11-22
Авторы: glenn-jocher (3)

Комментарии