Набор данных CIFAR-10

Набор данных CIFAR-10 (Канадский институт перспективных исследований) — это коллекция изображений, широко используемая для алгоритмов машинного обучения и компьютерного зрения. Он был разработан исследователями из института CIFAR и состоит из 60 000 цветных изображений размером 32x32 в 10 различных классах.



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

Основные характеристики

  • Набор данных CIFAR-10 состоит из 60 000 изображений, разделенных на 10 классов.
  • Каждый класс содержит 6 000 изображений, разделенных на 5 000 для обучения и 1 000 для тестирования.
  • Изображения цветные и имеют размер 32x32 пикселя.
  • 10 различных классов представляют собой самолеты, автомобили, птиц, кошек, оленей, собак, лягушек, лошадей, корабли и грузовики.
  • CIFAR-10 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-10 разделен на два подмножества:

  1. Обучающий набор: это подмножество содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Приложения

Набор данных CIFAR-10 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его полноценным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-10 в течение 100 эпох с размером изображения 32x32, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице обучения модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Примеры изображений и аннотаций

Набор данных CIFAR-10 содержит цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора данных:

Примеры набора данных для классификации изображений CIFAR-10

Этот пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-10, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если ты используешь набор данных CIFAR-10 в своей исследовательской работе или разработке, пожалуйста, укажи следующую статью:

Цитата
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы поблагодарить Алекса Крижевского за создание и поддержку набора данных CIFAR-10 как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-10 и его создателе посети сайт набора данных CIFAR-10.

Часто задаваемые вопросы (FAQ)

Как я могу обучить модель YOLO на наборе данных CIFAR-10?

Чтобы обучить модель YOLO на наборе данных CIFAR-10 с помощью Ultralytics, ты можешь следовать примерам, предоставленным как для Python, так и для CLI. Вот базовый пример обучения твоей модели в течение 100 эпох с размером изображения 32x32 пикселя:

Пример
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Для получения более подробной информации обратись к странице обучения модели.

Каковы ключевые особенности набора данных CIFAR-10?

Набор данных CIFAR-10 состоит из 60 000 цветных изображений, разделенных на 10 классов. Каждый класс содержит 6 000 изображений: 5 000 для обучения и 1 000 для тестирования. Изображения имеют размер 32x32 пикселя и варьируются по следующим категориям:

  • Самолеты
  • Автомобили
  • Птицы
  • Кошки
  • Олени
  • Собаки
  • Лягушки
  • Лошади
  • Корабли
  • Грузовики

Этот разнообразный набор данных необходим для обучения моделей классификации изображений в таких областях, как машинное обучение и компьютерное зрение. Для получения дополнительной информации посети разделы CIFAR-10 по структуре набора данных и применению.

Почему стоит использовать набор данных CIFAR-10 для задач классификации изображений?

Набор данных CIFAR-10 является отличным бенчмарком для классификации изображений благодаря своему разнообразию и структуре. Он содержит сбалансированную смесь из 60 000 размеченных изображений по 10 различным категориям, что помогает в обучении надежных и обобщенных моделей. Он широко используется для оценки моделей глубокого обучения, включая сверточные нейронные сети (CNN) и другие алгоритмы машинного обучения. Набор данных относительно невелик, что делает его подходящим для быстрого экспериментирования и разработки алгоритмов. Изучи его многочисленные применения в разделе применения.

Как структурирован набор данных CIFAR-10?

Набор данных CIFAR-10 структурирован в два основных подмножества:

  1. Обучающий набор: содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: состоит из 10 000 изображений для тестирования и оценки обученных моделей.

Каждое подмножество включает изображения, разбитые на 10 классов, а их аннотации доступны для обучения и оценки моделей. Для получения более подробной информации обратись к разделу структура набора данных.

Как я могу сослаться на набор данных CIFAR-10 в своем исследовании?

Если ты используешь набор данных CIFAR-10 в своих исследовательских или проектных разработках, обязательно укажи следующую статью:

Цитата
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Выражение признательности создателям набора данных помогает поддерживать дальнейшие исследования и разработки в этой области. Для получения подробной информации см. раздел цитирования и благодарности.

Какие существуют практические примеры использования набора данных CIFAR-10?

Набор данных CIFAR-10 часто используется для обучения моделей классификации изображений, таких как сверточные нейронные сети (CNN) и машины опорных векторов (SVM). Эти модели могут применяться в различных задачах компьютерного зрения, включая обнаружение объектов, распознавание изображений и автоматическую тегировку. Чтобы увидеть практические примеры, ознакомься с фрагментами кода в разделе использование.

Комментарии