Перейти к содержанию

Набор данных CIFAR-10

CIFAR-10 (Канадский институт перспективных исследований) — это коллекция изображений, широко используемая для машинного обучения и алгоритмов компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений размером 32x32 в 10 различных классах.



Смотреть: Как обучить Классификация изображений Модель с набором данных CIFAR-10, использующая Ultralytics YOLO11

Основные характеристики

  • Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
  • Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
  • Изображения цветные и имеют размер 32x32 пикселя.
  • 10 различных классов представляют самолеты, автомобили, птиц, кошек, оленей, собак, лягушек, лошадей, корабли и грузовики.
  • CIFAR-10 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-10 разделен на два подмножества:

  1. Обучающий набор: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: Этот поднабор состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Приложения

Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его хорошо сбалансированным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-10 в течение 100 эпох с размером изображения 32x32, вы можете использовать следующие фрагменты кода. Для получения полного списка доступных аргументов обратитесь к странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Примеры изображений и аннотации

Набор данных CIFAR-10 содержит цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Образец изображения набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если вы используете набор данных CIFAR-10 в своих исследованиях или разработках, пожалуйста, сошлитесь на следующую статью:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-10 в качестве ценного ресурса для машинного обучения и исследовательского сообщества компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-10 и его создателе посетите веб-сайт набора данных CIFAR-10.

Часто задаваемые вопросы

Как я могу обучить модель YOLO на наборе данных CIFAR-10?

Чтобы обучить модель YOLO на наборе данных CIFAR-10 с использованием Ultralytics, вы можете следовать примерам, представленным для Python и CLI. Вот основной пример для обучения вашей модели в течение 100 эпох с размером изображения 32x32 пикселя:

Пример

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Для получения более подробной информации обратитесь к странице обучения модели.

Каковы основные характеристики набора данных CIFAR-10?

Набор данных CIFAR-10 состоит из 60 000 цветных изображений, разделенных на 10 классов. Каждый класс содержит 6 000 изображений, из которых 5 000 предназначены для обучения и 1 000 для тестирования. Изображения имеют размер 32x32 пикселя и различаются по следующим категориям:

  • Самолеты
  • Автомобили
  • Птицы
  • Кошки
  • Олень
  • Собаки
  • Лягушки
  • Лошади
  • Корабли
  • Грузовики

Этот разнообразный набор данных необходим для обучения моделей классификации изображений в таких областях, как машинное обучение и компьютерное зрение. Для получения дополнительной информации посетите разделы CIFAR-10 о структуре набора данных и приложениях.

Зачем использовать набор данных CIFAR-10 для задач классификации изображений?

Набор данных CIFAR-10 является отличным эталоном для классификации изображений благодаря своему разнообразию и структуре. Он содержит сбалансированное сочетание 60 000 помеченных изображений по 10 различным категориям, что помогает в обучении надежных и обобщенных моделей. Он широко используется для оценки моделей глубокого обучения, включая Convolutional Neural Networks (CNNs) и другие алгоритмы машинного обучения. Набор данных относительно невелик, что делает его пригодным для быстрых экспериментов и разработки алгоритмов. Изучите его многочисленные применения в разделе applications.

Какова структура набора данных CIFAR-10?

Набор данных CIFAR-10 структурирован в два основных подмножества:

  1. Обучающий набор: Содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: Состоит из 10 000 изображений для тестирования и оценки обученных моделей.

Каждый поднабор содержит изображения, классифицированные по 10 классам, с аннотациями, доступными для обучения и оценки модели. Более подробную информацию можно найти в разделе структура набора данных.

Как я могу сослаться на набор данных CIFAR-10 в своем исследовании?

Если вы используете набор данных CIFAR-10 в своих исследовательских или опытно-конструкторских проектах, обязательно сошлитесь на следующую статью:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Выражение признательности создателям набора данных помогает поддерживать дальнейшие исследования и разработки в этой области. Для получения более подробной информации см. раздел цитирования и благодарности.

Каковы некоторые практические примеры использования набора данных CIFAR-10?

Набор данных CIFAR-10 часто используется для обучения моделей классификации изображений, таких как сверточные нейронные сети (CNN) и машины опорных векторов (SVM). Эти модели могут использоваться в различных задачах компьютерного зрения, включая обнаружение объектов, распознавание изображений и автоматическую разметку. Чтобы увидеть практические примеры, ознакомьтесь с фрагментами кода в разделе использования.



📅 Создано 1 год назад ✏️ Обновлено 5 месяцев назад

Комментарии