Link to this sectionНабор данных MNIST#
Набор данных MNIST (Modified National Institute of Standards and Technology) представляет собой обширную базу рукописных цифр, которая широко используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем «перемешивания» образцов из оригинальных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.
Link to this sectionКлючевые особенности#
- MNIST содержит 60 000 обучающих и 10 000 тестовых изображений рукописных цифр.
- Набор данных состоит из полутоновых изображений размером 28×28 пикселей.
- Изображения нормализованы так, чтобы помещаться в bounding box 28×28 пикселей, и сглажены (anti-aliased), что добавляет уровни серого.
- MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.
Link to this sectionСтруктура набора данных#
Набор данных MNIST разделен на два подмножества:
- Обучающий набор: это подмножество содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
- Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.
Link to this sectionДоступ к набору данных#
- Оригинальные файлы: скачай gzip-архивы из оригинального архива MNIST, если тебе нужен прямой контроль над предобработкой.
- Загрузчик Ultralytics: используй
data="mnist"(илиdata="mnist160"для подмножества ниже) в своей команде, и набор данных будет автоматически загружен, конвертирован в PNG и закеширован.
Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его набором данных для обучения с учителем, идеально подходящим для задач классификации.
Link to this sectionРасширенный MNIST (EMNIST)#
Расширенный MNIST (EMNIST) — это более новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включал изображения только рукописных цифр, EMNIST содержит все изображения из NIST Special Database 19, представляющей собой большую базу данных рукописных заглавных и строчных букв, а также цифр. Изображения в EMNIST были конвертированы в тот же формат 28×28 пикселей по тому же процессу, что и изображения MNIST. Соответственно, инструменты, работающие со старым, меньшим набором данных MNIST, скорее всего, будут работать с EMNIST без модификаций.
Link to this sectionПрименение#
Набор данных MNIST широко используется для обучения и оценки моделей глубинного обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Простой и хорошо структурированный формат набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.
Некоторые распространенные области применения:
- Сравнительное тестирование новых алгоритмов классификации
- Образовательные цели для обучения концепциям машинного обучения
- Прототипирование систем распознавания изображений
- Тестирование методов оптимизации моделей
Link to this sectionИспользование#
Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 28×28, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionПримеры изображений и аннотации#
Набор данных MNIST содержит полутоновые изображения рукописных цифр, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных MNIST в своей исследовательской или разработческой работе, пожалуйста, сошлися на следующую публикацию:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Мы хотели бы выразить признательность Янну Лекуну, Коринне Кортес и Кристоферу Дж.К. Берджесу за создание и поддержку набора данных MNIST в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети веб-сайт набора данных MNIST.
Link to this sectionБыстрые тесты MNIST160#
Нужен молниеносный регрессионный тест? Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий первые восемь изображений каждой цифры (0-9) как из обучающей, так и из тестовой выборок. Он повторяет структуру каталогов MNIST, поэтому ты можешь менять наборы данных, не меняя никаких других аргументов:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Используй это подмножество для CI-конвейеров или проверки работоспособности перед фиксацией изменений для полного набора данных из 70 000 изображений.
Link to this sectionFAQ#
Link to this sectionЧто такое набор данных MNIST и почему он важен в машинном обучении?#
Набор данных MNIST, или набор данных Modified National Institute of Standards and Technology, представляет собой широко используемую коллекцию рукописных цифр, предназначенную для обучения и тестирования систем классификации изображений. Он включает 60 000 обучающих и 10 000 тестовых изображений, все из которых являются полутоновыми и имеют размер 28×28 пикселей. Важность этого набора данных заключается в его роли в качестве стандартного эталона для оценки алгоритмов классификации изображений, что помогает исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.
Link to this sectionКак я могу использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?#
Чтобы обучить модель на наборе данных MNIST с помощью Ultralytics YOLO, ты можешь выполнить следующие шаги:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Для получения подробного списка доступных аргументов обучения обратись к странице обучения.
Link to this sectionВ чем разница между наборами данных MNIST и EMNIST?#
Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и заглавные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат изображения 28×28 пикселей, что делает его совместимым с инструментами и моделями, разработанными для оригинального набора данных MNIST. Этот более широкий набор символов в EMNIST делает его полезным для более разнообразных задач машинного обучения.
Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST?#
Да, ты можешь использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST. Платформа Ultralytics предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости глубоких знаний в программировании. Для получения дополнительной информации о том, как начать, посети страницу быстрого запуска платформы Ultralytics.
Link to this sectionКак MNIST соотносится с другими наборами данных для классификации изображений?#
MNIST проще многих современных наборов данных, таких как CIFAR-10 или ImageNet, что делает его идеальным для новичков и быстрых экспериментов. Хотя более сложные наборы данных предлагают более серьезные задачи с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и историческому значению в развитии алгоритмов машинного обучения. Для более продвинутых задач классификации рассмотри возможность использования Fashion-MNIST, который поддерживает ту же структуру, но содержит изображения предметов одежды вместо цифр.