Перейти к содержанию

Набор данных MNIST

Датасет MNIST (Modified National Institute of Standards and Technology) — это большая база данных рукописных цифр, которая обычно используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем "перемешивания" образцов из оригинальных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.

Основные характеристики

  • MNIST содержит 60 000 обучающих изображений и 10 000 тестовых изображений рукописных цифр.
  • Набор данных состоит из изображений в градациях серого размером 28×28 пикселей.
  • Изображения нормализуются для соответствия ограничивающей рамке размером 28×28 пикселей и сглаживаются, вводя уровни серого.
  • MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.

Структура набора данных

Набор данных MNIST разделен на два подмножества:

  1. Обучающий набор: Этот поднабор содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: Этот поднабор состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его набором данных для обучения с учителем, идеально подходящим для задач классификации.

Расширенный MNIST (EMNIST)

Extended MNIST (EMNIST) — это новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включал изображения только рукописных цифр, EMNIST включает все изображения из специальной базы данных NIST 19, которая представляет собой большую базу данных рукописных прописных и строчных букв, а также цифр. Изображения в EMNIST были преобразованы в тот же формат 28×28 пикселей тем же процессом, что и изображения MNIST. Соответственно, инструменты, которые работают со старым, меньшим набором данных MNIST, скорее всего, будут работать без изменений с EMNIST.

Приложения

Набор данных MNIST широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Простой и хорошо структурированный формат набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.

Некоторые распространенные приложения включают:

  • Бенчмаркинг новых алгоритмов классификации
  • В образовательных целях для обучения концепциям машинного обучения
  • Прототипирование систем распознавания изображений
  • Тестирование методов оптимизации модели

Использование

Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 32×32, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Примеры изображений и аннотации

Набор данных MNIST содержит изображения рукописных цифр в градациях серого, что обеспечивает хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Образец изображения набора данных

Этот пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если вы используете набор данных MNIST в своих исследованиях или разработках, пожалуйста, сошлитесь на следующую статью:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Мы хотели бы выразить признательность Яну ЛеКуну, Коринне Кортес и Кристоферу Дж. К. Бургесу за создание и поддержку набора данных MNIST в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посетите веб-сайт набора данных MNIST.

Часто задаваемые вопросы

Что такое набор данных MNIST и почему он важен в машинном обучении?

Датасет MNIST, или Modified National Institute of Standards and Technology, представляет собой широко используемую коллекцию рукописных цифр, предназначенную для обучения и тестирования систем классификации изображений. Он включает в себя 60 000 обучающих изображений и 10 000 тестовых изображений, все из которых являются полутоновыми и имеют размер 28×28 пикселей. Важность этого датасета заключается в его роли стандартного эталона для оценки алгоритмов классификации изображений, помогающего исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.

Как я могу использовать Ultralytics YOLO для обучения модели на датасете MNIST?

Чтобы обучить модель на наборе данных MNIST с использованием Ultralytics YOLO, вы можете выполнить следующие шаги:

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Подробный список доступных аргументов обучения см. на странице Обучение.

В чем разница между наборами данных MNIST и EMNIST?

Набор данных MNIST содержит только рукописные цифры, тогда как расширенный набор данных MNIST (EMNIST) включает как цифры, так и буквы верхнего и нижнего регистра. EMNIST был разработан как преемник MNIST и использует тот же формат 28×28 пикселей для изображений, что делает его совместимым с инструментами и моделями, разработанными для оригинального набора данных MNIST. Этот более широкий диапазон символов в EMNIST делает его полезным для более широкого спектра приложений машинного обучения.

Могу ли я использовать Ultralytics HUB для обучения моделей на пользовательских наборах данных, таких как MNIST?

Да, вы можете использовать Ultralytics HUB для обучения моделей на пользовательских наборах данных, таких как MNIST. Ultralytics HUB предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости обширных знаний в области кодирования. Для получения более подробной информации о том, как начать работу, ознакомьтесь со страницей Ultralytics HUB Quickstart.

Как MNIST соотносится с другими наборами данных для классификации изображений?

MNIST проще, чем многие современные наборы данных, такие как CIFAR-10 или ImageNet, что делает его идеальным для начинающих и быстрых экспериментов. Хотя более сложные наборы данных предлагают большие проблемы с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файла и исторической значимости в разработке алгоритмов машинного обучения. Для более сложных задач классификации рассмотрите возможность использования Fashion-MNIST, который сохраняет ту же структуру, но содержит предметы одежды вместо цифр.



📅 Создано 1 год назад ✏️ Обновлено 5 месяцев назад

Комментарии