Набор данных MNIST

Набор данных MNIST (Modified National Institute of Standards and Technology) представляет собой большую базу данных рукописных цифр, которая широко используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем «перемешивания» образцов из исходных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.

Основные характеристики

  • MNIST содержит 60 000 обучающих и 10 000 тестовых изображений рукописных цифр.
  • Набор данных состоит из изображений в оттенках серого размером 28×28 пикселей.
  • Изображения нормализованы так, чтобы помещаться в ограничивающую рамку размером 28×28 пикселей, и сглажены (anti-aliased), что добавляет полутона серого.
  • MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.

Структура набора данных

Набор данных MNIST разделен на два подмножества:

  1. Обучающая выборка: Это подмножество содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Доступ к набору данных

  • Оригинальные файлы: Скачай gzip-архивы из исходного архива MNIST, если тебе нужен прямой контроль над предобработкой.
  • Загрузчик Ultralytics: Используй data="mnist" (или data="mnist160" для подмножества ниже) в своей команде, и набор данных будет скачан, конвертирован в PNG и автоматически кэширован.

Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его идеальным набором данных с учителем для задач классификации.

Расширенный MNIST (EMNIST)

Расширенный MNIST (EMNIST) — это более новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включает изображения только рукописных цифр, EMNIST включает все изображения из NIST Special Database 19, которая представляет собой большую базу данных рукописных прописных и строчных букв, а также цифр. Изображения в EMNIST были преобразованы в тот же формат 28×28 пикселей тем же процессом, что и изображения MNIST. Соответственно, инструменты, которые работают со старым, меньшим набором данных MNIST, скорее всего, будут работать с EMNIST без изменений.

Приложения

Набор данных MNIST широко используется для обучения и оценки моделей глубинного обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), машины опорных векторов (SVM) и другие алгоритмы машинного обучения. Простой и хорошо структурированный формат этого набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.

Некоторые распространенные варианты использования:

  • Бенчмаркинг новых алгоритмов классификации
  • Образовательные цели для преподавания концепций машинного обучения
  • Прототипирование систем распознавания изображений
  • Тестирование методов оптимизации моделей

Использование

Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 28×28, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице Обучение.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Примеры изображений и аннотаций

Набор данных MNIST содержит изображения рукописных цифр в оттенках серого, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Примеры набора данных классификации рукописных цифр MNIST

Этот пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Цитирование и благодарности

Если ты используешь набор данных MNIST в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Мы хотели бы выразить признательность Янну Лекуну, Коринне Кортес и Кристоферу Дж. К. Берджессу за создание и поддержание набора данных MNIST в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети веб-сайт набора данных MNIST.

Быстрые тесты MNIST160

Нужен молниеносный регрессионный тест? Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий по восемь первых образцов для каждого класса цифр. Он зеркально повторяет структуру каталогов MNIST, поэтому ты можешь менять наборы данных, не меняя другие аргументы:

Пример обучения с MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Используй это подмножество для CI-пайплайнов или проверки работоспособности перед фиксацией кода для всего набора из 70 000 изображений.

Часто задаваемые вопросы (FAQ)

Что такое набор данных MNIST и почему он важен в машинном обучении?

Набор данных MNIST, или Modified National Institute of Standards and Technology, — это широко используемая коллекция рукописных цифр, предназначенная для обучения и тестирования систем классификации изображений. Он включает 60 000 обучающих и 10 000 тестовых изображений, все из которых являются изображениями в оттенках серого размером 28×28 пикселей. Важность этого набора данных заключается в его роли в качестве стандартного эталона для оценки алгоритмов классификации изображений, что помогает исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.

Как использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?

Чтобы обучить модель на наборе данных MNIST с помощью Ultralytics YOLO, ты можешь выполнить следующие шаги:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Подробный список доступных аргументов обучения смотри на странице Обучение.

В чем разница между наборами данных MNIST и EMNIST?

Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и прописные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат изображений 28×28 пикселей, что делает его совместимым с инструментами и моделями, созданными для оригинального набора данных MNIST. Этот более широкий набор символов в EMNIST делает его полезным для более широкого спектра приложений машинного обучения.

Могу ли я использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST?

Да, ты можешь использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST. Платформа Ultralytics предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости глубоких знаний программирования. Подробнее о том, как начать работу, смотри на странице быстрого старта платформы Ultralytics.

Как MNIST соотносится с другими наборами данных для классификации изображений?

MNIST проще, чем многие современные наборы данных, такие как CIFAR-10 или ImageNet, что делает его идеальным для новичков и быстрых экспериментов. Хотя более сложные наборы данных предлагают большие задачи с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и исторической значимости в развитии алгоритмов машинного обучения. Для более продвинутых задач классификации рассмотри возможность использования Fashion-MNIST, который сохраняет ту же структуру, но содержит предметы одежды вместо цифр.

Комментарии