Перейти к содержанию

Набор данных CIFAR-100

Набор данных CIFAR-100 (Канадский институт перспективных исследований) является значительным расширением набора данных CIFAR-10 и состоит из 60 000 цветных изображений размером 32x32 в 100 различных классах. Он был разработан исследователями из института CIFAR и предлагает более сложный набор данных для более сложных задач машинного обучения и компьютерного зрения.



Смотреть: Как обучить Ultralytics YOLO11 на CIFAR-100 | Пошаговое руководство по классификации изображений 🚀

Основные характеристики

  • Набор данных CIFAR-100 состоит из 60 000 изображений, разделенных на 100 классов.
  • Каждый класс содержит 600 изображений, разделенных на 500 для обучения и 100 для тестирования.
  • Изображения цветные и имеют размер 32x32 пикселя.
  • 100 различных классов сгруппированы в 20 основных категорий для классификации на более высоком уровне.
  • CIFAR-100 обычно используется для обучения и тестирования в области машинного обучения и компьютерного зрения.

Структура набора данных

Набор данных CIFAR-100 разделен на два подмножества:

  1. Обучающий набор: Этот поднабор содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: Этот поднабор состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Приложения

Набор данных CIFAR-100 широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Разнообразие набора данных с точки зрения классов и наличие цветных изображений делают его более сложным и полным набором данных для исследований и разработок в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель YOLO на наборе данных CIFAR-100 в течение 100 эпох с размером изображения 32x32, вы можете использовать следующие фрагменты кода. Для получения полного списка доступных аргументов обратитесь к странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Примеры изображений и аннотации

Набор данных CIFAR-100 содержит цветные изображения различных объектов, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Образец изображения набора данных

Пример демонстрирует разнообразие и сложность объектов в наборе данных CIFAR-100, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если вы используете набор данных CIFAR-100 в своих исследованиях или разработках, пожалуйста, сошлитесь на следующую статью:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Мы хотели бы выразить признательность Алексу Крижевскому за создание и поддержку набора данных CIFAR-100 в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных CIFAR-100 и его создателе посетите веб-сайт набора данных CIFAR-100.

Часто задаваемые вопросы

Что такое набор данных CIFAR-100 и почему он важен?

Набор данных CIFAR-100 dataset представляет собой большую коллекцию из 60 000 цветных изображений размером 32x32, классифицированных по 100 классам. Разработанный Канадским институтом перспективных исследований (CIFAR), он предоставляет сложный набор данных, идеально подходящий для сложных задач машинного обучения и компьютерного зрения. Его значимость заключается в разнообразии классов и небольшом размере изображений, что делает его ценным ресурсом для обучения и тестирования моделей глубокого обучения, таких как сверточные нейронные сети (CNN), с использованием таких фреймворков, как Ultralytics YOLO.

Как обучить модель YOLO на наборе данных CIFAR-100?

Вы можете обучить модель YOLO на наборе данных CIFAR-100, используя команды python или CLI. Вот как:

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Для получения полного списка доступных аргументов обратитесь к странице Обучение модели.

Каковы основные области применения набора данных CIFAR-100?

Набор данных CIFAR-100 широко используется для обучения и оценки моделей глубокого обучения для классификации изображений. Его разнообразный набор из 100 классов, сгруппированных в 20 крупных категорий, обеспечивает сложную среду для тестирования алгоритмов, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие подходы машинного обучения. Этот набор данных является ключевым ресурсом в исследованиях и разработках в области машинного обучения и компьютерного зрения, особенно для задач распознавания объектов и классификации.

Какова структура набора данных CIFAR-100?

Набор данных CIFAR-100 разделен на два основных подмножества:

  1. Обучающий набор: Содержит 50 000 изображений, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: Состоит из 10 000 изображений, используемых для тестирования и бенчмаркинга обученных моделей.

Каждый из 100 классов содержит 600 изображений: 500 для обучения и 100 для тестирования, что делает его уникально подходящим для строгих академических и промышленных исследований.

Где я могу найти sample_images и аннотации из набора данных CIFAR-100?

Набор данных CIFAR-100 включает в себя множество цветных изображений различных объектов, что делает его структурированным набором данных для задач классификации изображений. Вы можете обратиться к странице документации, чтобы увидеть примеры изображений и аннотации. Эти примеры подчеркивают разнообразие и сложность набора данных, что важно для обучения надежных моделей классификации изображений. Чтобы узнать о других наборах данных, подходящих для задач классификации, ознакомьтесь с обзором наборов данных для классификации Ultralytics.



📅 Создано 1 год назад ✏️ Обновлено 5 месяцев назад

Комментарии