Набор данных CIFAR-10
Набор данных CIFAR-10 (Канадский институт перспективных исследований) — это коллекция изображений, широко используемая для алгоритмов машинного обучения и компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений размером 32x32 в 10 различных классах.
Основные характеристики
- Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
- Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
- Изображения цветные и имеют размер 32x32 пикселя.
- 10 различных классов представляют собой самолеты, автомобили, птиц, кошек, оленей, собак, лягушек, лошадей, корабли и грузовики.
- CIFAR-10 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.
Структура набора данных
Набор данных CIFAR-10 разделен на два подмножества:
- Обучающий набор: это подмножество содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
- Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.
Приложения
Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его полноценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.
Использование
Чтобы обучить модель YOLO на наборе данных CIFAR-10 в течение 100 эпох с размером изображения 32x32, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Примеры изображений и аннотаций
Набор данных CIFAR-10 содержит цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора данных:

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.
Цитирование и благодарности
Если ты используешь набор данных CIFAR-10 в своей исследовательской работе или разработке, пожалуйста, укажи следующую статью:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-10 и его создателе посети сайт набора данных CIFAR-10.
Часто задаваемые вопросы (FAQ)
Как я могу обучить модель YOLO на наборе данных CIFAR-10?
Чтобы обучить модель YOLO на наборе данных CIFAR-10 с помощью Ultralytics, ты можешь следовать примерам, предоставленным как для Python, так и для CLI. Вот базовый пример обучения твоей модели в течение 100 эпох с размером изображения 32x32 пикселя:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Для получения более подробной информации обратись к странице обучения модели.
Каковы ключевые особенности набора данных CIFAR-10?
Набор данных CIFAR-10 состоит из 60 000 цветных изображений, разделенных на 10 классов. Каждый класс содержит 6 000 изображений: 5 000 для обучения и 1 000 для тестирования. Изображения имеют размер 32x32 пикселя и варьируются по следующим категориям:
- Самолеты
- Автомобили
- Птицы
- Кошки
- Олени
- Собаки
- Лягушки
- Лошади
- Корабли
- Грузовики
Этот разнообразный набор данных необходим для обучения моделей классификации изображений в таких областях, как машинное обучение и компьютерное зрение. Для получения дополнительной информации посети разделы CIFAR-10 по структуре набора данных и применению.
Почему стоит использовать набор данных CIFAR-10 для задач классификации изображений?
Набор данных CIFAR-10 является отличным бенчмарком для классификации изображений благодаря своему разнообразию и структуре. Он содержит сбалансированную смесь из 60 000 размеченных изображений по 10 различным категориям, что помогает в обучении надежных и обобщенных моделей. Он широко используется для оценки моделей глубокого обучения, включая сверточные нейронные сети (CNN) и другие алгоритмы машинного обучения. Набор данных относительно невелик, что делает его подходящим для быстрого экспериментирования и разработки алгоритмов. Изучи его многочисленные применения в разделе применения.
Как структурирован набор данных CIFAR-10?
Набор данных CIFAR-10 структурирован в два основных подмножества:
- Обучающий набор: содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
- Тестовый набор: состоит из 10 000 изображений для тестирования и оценки обученных моделей.
Каждое подмножество включает изображения, разбитые на 10 классов, а их аннотации доступны для обучения и оценки моделей. Для получения более подробной информации обратись к разделу структура набора данных.
Как я могу сослаться на набор данных CIFAR-10 в своем исследовании?
Если ты используешь набор данных CIFAR-10 в своих исследовательских или проектных разработках, обязательно укажи следующую статью:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Выражение признательности создателям набора данных помогает поддерживать дальнейшие исследования и разработки в этой области. Для получения подробной информации см. раздел цитирования и благодарности.
Какие существуют практические примеры использования набора данных CIFAR-10?
Набор данных CIFAR-10 часто используется для обучения моделей классификации изображений, таких как сверточные нейронные сети (CNN) и машины опорных векторов (SVM). Эти модели могут применяться в различных задачах компьютерного зрения, включая обнаружение объектов, распознавание изображений и автоматическую тегировку. Чтобы увидеть практические примеры, ознакомься с фрагментами кода в разделе использование.