Link to this sectionНабор данных MNIST#
Набор данных MNIST (Modified National Institute of Standards and Technology) — это обширная база данных рукописных цифр, которая обычно используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем «перемешивания» образцов из оригинальных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.
Link to this sectionКлючевые особенности#
- MNIST содержит 60 000 обучающих и 10 000 тестовых изображений рукописных цифр.
- Набор данных включает изображения в оттенках серого размером 28×28 пикселей.
- Изображения нормализованы так, чтобы вписываться в bounding box 28×28 пикселей, и сглажены, что добавляет уровни яркости серого.
- MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.
Link to this sectionСтруктура набора данных#
Набор данных MNIST разделен на два подмножества:
- Обучающая выборка (Training Set): Это подмножество содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
- Тестовая выборка (Testing Set): Это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.
Link to this sectionДоступ к набору данных#
- Оригинальные файлы: Скачай gzip-архивы из оригинального архива MNIST, если хочешь напрямую управлять предобработкой.
- Загрузчик Ultralytics: Используй
data="mnist"(илиdata="mnist160"для подмножества ниже) в своей команде, и набор данных будет автоматически скачан, преобразован в PNG и кэширован.
Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его набором данных для обучения с учителем, идеально подходящим для задач классификации.
Link to this sectionРасширенный MNIST (EMNIST)#
Расширенный MNIST (EMNIST) — это более новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включал изображения только рукописных цифр, EMNIST включает все изображения из NIST Special Database 19, что представляет собой большую базу данных рукописных прописных и строчных букв, а также цифр. Изображения в EMNIST были преобразованы в тот же формат 28×28 пикселей по тому же процессу, что и изображения MNIST. Соответственно, инструменты, работающие со старым, меньшим набором данных MNIST, скорее всего, будут работать с EMNIST без изменений.
Link to this sectionПрименение#
Набор данных MNIST широко используется для обучения и оценки моделей глубинного обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), методы опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Простой и хорошо структурированный формат набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.
Некоторые распространенные приложения включают:
- Тестирование новых алгоритмов классификации
- Образовательные цели для обучения концепциям машинного обучения
- Прототипирование систем распознавания изображений
- Тестирование методов оптимизации моделей
Link to this sectionИспользование#
Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 28×28, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionПримеры изображений и аннотации#
Набор данных MNIST содержит изображения рукописных цифр в оттенках серого, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Этот пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных MNIST в своей исследовательской или проектной работе, пожалуйста, укажи следующую статью:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Мы хотели бы выразить признательность Янну Лекуну, Коринне Кортес и Кристоферу Дж. К. Берджесу за создание и поддержку набора данных MNIST в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети сайт набора данных MNIST.
Link to this sectionБыстрые тесты MNIST160#
Нужен молниеносно быстрый регрессионный тест? Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий первые восемь изображений каждой цифры (0-9) как из обучающей, так и из тестовой выборок. Он повторяет структуру каталогов MNIST, поэтому ты можешь менять наборы данных, не меняя никаких других аргументов:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Используй это подмножество для CI-конвейеров или проверок работоспособности перед тем, как переходить к полному набору данных из 70 000 изображений.
Link to this sectionFAQ#
Link to this sectionЧто такое набор данных MNIST и почему он важен в машинном обучении?#
Набор данных MNIST, или Modified National Institute of Standards and Technology, — это широко используемая коллекция рукописных цифр, предназначенная для обучения и тестирования систем классификации изображений. Он включает 60 000 обучающих и 10 000 тестовых изображений, все из которых являются изображениями в оттенках серого размером 28×28 пикселей. Важность этого набора данных заключается в его роли стандартного эталона для оценки алгоритмов классификации изображений, помогая исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.
Link to this sectionКак я могу использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?#
Чтобы обучить модель на наборе данных MNIST с помощью Ultralytics YOLO, ты можешь выполнить следующие шаги:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Для получения подробного списка доступных аргументов обучения обратись к странице обучения.
Link to this sectionВ чем разница между наборами данных MNIST и EMNIST?#
Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и прописные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат изображений 28×28 пикселей, что делает его совместимым с инструментами и моделями, разработанными для оригинального набора данных MNIST. Этот более широкий набор символов в EMNIST делает его полезным для более разнообразных приложений машинного обучения.
Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST?#
Да, ты можешь использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST. Платформа Ultralytics предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости обширных знаний в программировании. Для получения дополнительных сведений о том, как начать работу, ознакомься со страницей быстрого запуска платформы Ultralytics.
Link to this sectionКак MNIST соотносится с другими наборами данных для классификации изображений?#
MNIST проще, чем многие современные наборы данных, такие как CIFAR-10 или ImageNet, что делает его идеальным для начинающих и для быстрых экспериментов. Хотя более сложные наборы данных предлагают большие проблемы с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и исторической значимости в развитии алгоритмов машинного обучения. Для более продвинутых задач классификации рассмотри использование Fashion-MNIST, который сохраняет ту же структуру, но содержит предметы одежды вместо цифр.