Перейти к содержанию

Набор данных CIFAR-10

Набор данных CIFAR-10 (Canadian Institute For Advanced Research) - это коллекция изображений, широко используемых в алгоритмах машинного обучения и компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений 32x32 в 10 различных классах.



Смотреть: Как обучить Классификация изображений Модель с набором данных CIFAR-10 с использованием Ultralytics YOLO11

Основные характеристики

  • Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
  • Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
  • Изображения цветные и имеют размер 32x32 пикселя.
  • В 10 различных классах представлены самолеты, автомобили, птицы, кошки, олени, собаки, лягушки, лошади, корабли и грузовики.
  • CIFAR-10 широко используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-10 разделен на два подмножества:

  1. Набор для обучения: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Набор для тестирования: Это подмножество состоит из 10 000 изображений, используемых для тестирования и проверки обученных моделей.

Приложения

Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие наборов данных с точки зрения классов и наличие цветных изображений делают их хорошо подходящими для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Для обучения модели YOLO на наборе данных CIFAR-10 в течение 100 эпох при размере изображения 32x32 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Образцы изображений и аннотаций

Набор данных CIFAR-10 содержит цветные изображения различных объектов и представляет собой хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразных наборов данных для обучения надежных моделей классификации изображений.

Цитаты и благодарности

Если вы используете набор данных CIFAR-10 в своих исследованиях или разработках, пожалуйста, ссылайтесь на следующий документ:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы выразить благодарность Алексу Крижевскому за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных CIFAR-10 и его создателе можно найти на сайте набора данных CIFAR-10.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Как обучить модель YOLO на наборе данных CIFAR-10?

Чтобы обучить модель YOLO на наборе данных CIFAR-10 с помощью Ultralytics, вы можете следовать приведенным примерам как для Python , так и для CLI. Вот базовый пример для обучения модели в течение 100 эпох с размером изображения 32x32 пикселя:

Пример

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Более подробную информацию см. на странице Обучение модели.

Каковы ключевые особенности набора данных CIFAR-10?

Набор данных CIFAR-10 состоит из 60 000 цветных изображений, разделенных на 10 классов. Каждый класс содержит 6 000 изображений, из которых 5 000 предназначены для обучения и 1 000 - для тестирования. Изображения имеют размер 32x32 пикселя и относятся к следующим категориям:

  • Самолеты
  • Автомобили
  • Птицы
  • Кошки
  • Олень
  • Собаки
  • Лягушки
  • Лошади
  • Корабли
  • Грузовики

Этот разнообразный набор данных необходим для обучения моделей классификации изображений в таких областях, как машинное обучение и компьютерное зрение. Для получения дополнительной информации посетите разделы CIFAR-10, посвященные структуре набора данных и приложениям.

Почему стоит использовать набор данных CIFAR-10 для задач классификации изображений?

Набор данных CIFAR-10 является отличным эталоном для классификации изображений благодаря своему разнообразию и структуре. Он содержит сбалансированную смесь из 60 000 помеченных изображений по 10 различным категориям, что помогает в обучении надежных и обобщенных моделей. Он широко используется для оценки моделей глубокого обучения, включая конволюционные нейронные сети (CNN) и другие алгоритмы машинного обучения. Набор данных относительно небольшой, что делает его подходящим для быстрых экспериментов и разработки алгоритмов. Ознакомьтесь с многочисленными возможностями его применения в разделе "Приложения ".

Как структурирован набор данных CIFAR-10?

Набор данных CIFAR-10 состоит из двух основных подмножеств:

  1. Набор для обучения: Содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Набор для тестирования: Состоит из 10 000 изображений для проверки и тестирования обученных моделей.

Каждое подмножество включает в себя изображения, распределенные по 10 классам, аннотации к которым легко доступны для обучения и оценки модели. Более подробная информация приведена в разделе " Структура набора данных".

Как я могу ссылаться на набор данных CIFAR-10 в своих исследованиях?

Если вы используете набор данных CIFAR-10 в своих исследованиях или проектах по разработке, обязательно ссылайтесь на следующий документ:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Благодарность создателям набора данных помогает поддерживать дальнейшие исследования и разработки в этой области. Более подробную информацию см. в разделе " Цитаты и благодарности ".

Каковы некоторые практические примеры использования набора данных CIFAR-10?

Набор данных CIFAR-10 часто используется для обучения моделей классификации изображений, таких как конволюционные нейронные сети (CNN) и машины опорных векторов (SVM). Эти модели могут применяться в различных задачах компьютерного зрения, включая обнаружение объектов, распознавание изображений и автоматическую маркировку. Чтобы увидеть несколько практических примеров, ознакомьтесь с фрагментами кода в разделе "Использование".

📅 Создано 1 год назад ✏️ Обновлено 8 дней назад

Комментарии