Набор данных CIFAR-10
Набор данных CIFAR-10 (Canadian Institute For Advanced Research) - это коллекция изображений, широко используемых в алгоритмах машинного обучения и компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений 32x32 в 10 различных классах.
Смотреть: Как обучить Классификация изображений Модель с набором данных CIFAR-10 с использованием Ultralytics YOLO11
Основные характеристики
- Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
- Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
- Изображения цветные и имеют размер 32x32 пикселя.
- В 10 различных классах представлены самолеты, автомобили, птицы, кошки, олени, собаки, лягушки, лошади, корабли и грузовики.
- CIFAR-10 широко используется для обучения и тестирования в области машинного обучения и компьютерного зрения.
Структура набора данных
Набор данных CIFAR-10 разделен на два подмножества:
- Набор для обучения: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
- Набор для тестирования: Это подмножество состоит из 10 000 изображений, используемых для тестирования и проверки обученных моделей.
Приложения
Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как конволюционные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие наборов данных с точки зрения классов и наличие цветных изображений делают их хорошо подходящими для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Для обучения модели YOLO на наборе данных CIFAR-10 в течение 100 эпох при размере изображения 32x32 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.
Пример поезда
Образцы изображений и аннотаций
Набор данных CIFAR-10 содержит цветные изображения различных объектов и представляет собой хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:
Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразных наборов данных для обучения надежных моделей классификации изображений.
Цитаты и благодарности
Если вы используете набор данных CIFAR-10 в своих исследованиях или разработках, пожалуйста, ссылайтесь на следующий документ:
Мы хотели бы выразить благодарность Алексу Крижевскому за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных CIFAR-10 и его создателе можно найти на сайте набора данных CIFAR-10.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Как обучить модель YOLO на наборе данных CIFAR-10?
Чтобы обучить модель YOLO на наборе данных CIFAR-10 с помощью Ultralytics, вы можете следовать приведенным примерам как для Python , так и для CLI. Вот базовый пример для обучения модели в течение 100 эпох с размером изображения 32x32 пикселя:
Пример
Более подробную информацию см. на странице Обучение модели.
Каковы ключевые особенности набора данных CIFAR-10?
Набор данных CIFAR-10 состоит из 60 000 цветных изображений, разделенных на 10 классов. Каждый класс содержит 6 000 изображений, из которых 5 000 предназначены для обучения и 1 000 - для тестирования. Изображения имеют размер 32x32 пикселя и относятся к следующим категориям:
- Самолеты
- Автомобили
- Птицы
- Кошки
- Олень
- Собаки
- Лягушки
- Лошади
- Корабли
- Грузовики
Этот разнообразный набор данных необходим для обучения моделей классификации изображений в таких областях, как машинное обучение и компьютерное зрение. Для получения дополнительной информации посетите разделы CIFAR-10, посвященные структуре набора данных и приложениям.
Почему стоит использовать набор данных CIFAR-10 для задач классификации изображений?
Набор данных CIFAR-10 является отличным эталоном для классификации изображений благодаря своему разнообразию и структуре. Он содержит сбалансированную смесь из 60 000 помеченных изображений по 10 различным категориям, что помогает в обучении надежных и обобщенных моделей. Он широко используется для оценки моделей глубокого обучения, включая конволюционные нейронные сети (CNN) и другие алгоритмы машинного обучения. Набор данных относительно небольшой, что делает его подходящим для быстрых экспериментов и разработки алгоритмов. Ознакомьтесь с многочисленными возможностями его применения в разделе "Приложения ".
Как структурирован набор данных CIFAR-10?
Набор данных CIFAR-10 состоит из двух основных подмножеств:
- Набор для обучения: Содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
- Набор для тестирования: Состоит из 10 000 изображений для проверки и тестирования обученных моделей.
Каждое подмножество включает в себя изображения, распределенные по 10 классам, аннотации к которым легко доступны для обучения и оценки модели. Более подробная информация приведена в разделе " Структура набора данных".
Как я могу ссылаться на набор данных CIFAR-10 в своих исследованиях?
Если вы используете набор данных CIFAR-10 в своих исследованиях или проектах по разработке, обязательно ссылайтесь на следующий документ:
Благодарность создателям набора данных помогает поддерживать дальнейшие исследования и разработки в этой области. Более подробную информацию см. в разделе " Цитаты и благодарности ".
Каковы некоторые практические примеры использования набора данных CIFAR-10?
Набор данных CIFAR-10 часто используется для обучения моделей классификации изображений, таких как конволюционные нейронные сети (CNN) и машины опорных векторов (SVM). Эти модели могут применяться в различных задачах компьютерного зрения, включая обнаружение объектов, распознавание изображений и автоматическую маркировку. Чтобы увидеть несколько практических примеров, ознакомьтесь с фрагментами кода в разделе "Использование".