No license

Link to this sectionНабор данных MNIST#

Набор данных MNIST (Modified National Institute of Standards and Technology) — это эталон классификации изображений, состоящий из 70 000 черно-белых изображений рукописных цифр размером 28x28 пикселей, разделенных на 10 классов — цифры от 0 до 9. Он поставляется с предопределенным разделением на 60 000 тренировочных и 10 000 тестовых изображений и долгое время служил стандартным бенчмарком для оценки алгоритмов машинного обучения и компьютерного зрения. Для более сложного аналога с изображениями одежды см. связанный набор данных Fashion-MNIST; для цветных изображений см. CIFAR-10.

Link to this sectionКлючевые особенности#

MNIST содержит 60 000 тренировочных и 10 000 тестовых изображений рукописных цифр, всего 70 000.
Каждое изображение представляет собой черно-белую картинку размером 28x28 с одной цифрой, нормализованную и сглаженную в фиксированной ограничивающей рамке 28x28.
10 классов охватывают цифры 0–9 с примерно одинаковым количеством изображений в каждом классе.
Он поставляется с предопределенным разделением на тренировочную и тестовую выборки, поэтому ручное или автоматическое разделение не требуется.
MNIST — это стандартный бенчмарк для исследований в области классификации изображений и глубокого обучения.

Link to this sectionСтруктура набора данных#

MNIST поставляется с официальным, предопределенным разделением, поэтому никакое автоматическое или ручное разбиение не требуется:

Классы: 10 (рукописные цифры 0–9)
Всего изображений: 70 000 (28x28, в оттенках серого)
Тренировочный набор: 60 000 изображений
Тестовый набор: 10 000 изображений

Валидационная выборка

В MNIST нет отдельной папки для валидации, поэтому Ultralytics по умолчанию использует тестовый набор из 10 000 изображений в качестве валидационной выборки во время обучения.

Каждое изображение помечено соответствующей цифрой (0–9), что делает MNIST набором данных для обучения с учителем, идеально подходящим для задач классификации.

Link to this sectionПрименение#

MNIST широко используется для обучения и оценки моделей классификации изображений, от классических сверточных нейронных сетей (CNN) и методов опорных векторов (SVM) до современных глубоких архитектур. Его небольшие черно-белые изображения и 10 классов цифр делают его быстрым и воспроизводимым бенчмарком для сравнения алгоритмов и экспериментов в области компьютерного зрения.

Некоторые распространенные приложения включают:

Тестирование новых алгоритмов классификации
Образовательные цели для обучения концепциям машинного обучения
Прототипирование систем распознавания изображений
Тестирование методов оптимизации моделей

Link to this sectionИспользование#

Обучи классификационную модель YOLO на MNIST в течение 100 эпох при размере изображения 28. Набор данных загружается и кэшируется автоматически при первом использовании; если ты предпочитаешь полный контроль над предварительной обработкой, оригинальные gzip-архивы также доступны в базе данных MNIST. Полный список доступных аргументов см. на странице обучения и в руководстве по задаче классификации изображений.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Быстрые тесты с MNIST160

Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий первые восемь изображений каждой цифры (0–9) как из тренировочного, так и из тестового наборов. Он зеркально повторяет структуру папок MNIST, поэтому ты можешь менять наборы данных, не меняя другие аргументы — это идеально подходит для CI-конвейеров или быстрых проверок перед запуском обучения на полном наборе из 70 000 изображений.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionПримеры изображений и аннотации#

Примеры изображений из набора данных MNIST:

Примеры набора данных классификации рукописных цифр MNIST

Примеры показывают разнообразие стилей почерка, которые охватывает набор данных для 10 классов цифр.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных MNIST в своей исследовательской или проектной работе, пожалуйста, укажи следующую статью:

Цитата

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Мы хотим поблагодарить Янна ЛеКуна, Коринну Кортес и Кристофера Дж. К. Берджеса за создание и поддержку набора данных MNIST как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети веб-сайт набора данных MNIST.

Link to this sectionFAQ#

Link to this sectionЧто такое набор данных MNIST и почему он важен в машинном обучении?#

Набор данных MNIST — это бенчмарк из 70 000 черно-белых изображений рукописных цифр размером 28x28, разделенных на 60 000 тренировочных и 10 000 тестовых изображений по 10 классам (0–9). Это стандартный эталон для оценки алгоритмов классификации изображений — его малый и единообразный формат позволяет исследователям и инженерам сравнивать методы и отслеживать прогресс с минимальной настройкой, поэтому он остается популярным первым бенчмарком в машинном обучении.

Link to this sectionСколько классов и изображений в наборе данных MNIST?#

В MNIST 10 классов — рукописные цифры от 0 до 9 — и всего 70 000 черно-белых изображений, каждое размером 28x28 пикселей. Он поставляется с предопределенным разделением на 60 000 тренировочных и 10 000 тестовых изображений, с примерно одинаковым количеством примеров для каждой цифры.

Link to this sectionКак я могу использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?#

Чтобы обучить модель Ultralytics YOLO на MNIST, используй фрагменты кода ниже. Набор данных загружается автоматически при первом использовании. Подробный список доступных аргументов обучения см. на странице обучения.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionКак набор данных MNIST разделен на тренировочную и тестовую выборки?#

MNIST поставляется с предопределенным разделением на 60 000 тренировочных и 10 000 тестовых изображений. В отличие от основанных на папках наборов данных для классификации, которые Ultralytics разделяет автоматически, официальное разбиение MNIST используется как есть, а тестовый набор по умолчанию служит валидационной выборкой во время обучения.

Link to this sectionВ чем разница между наборами данных MNIST и EMNIST?#

Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и прописные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат 28x28 пикселей, что делает его совместимым с инструментами и моделями, созданными для оригинального набора данных MNIST. Этот более широкий диапазон символов делает EMNIST полезным для более разнообразных приложений машинного обучения.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на таких наборах данных, как MNIST?#

Да. Платформа Ultralytics позволяет загружать наборы данных, обучать модели классификации изображений и развертывать их без глубокого программирования. Это удобный способ запускать эксперименты с MNIST в облаке — смотри обзор наборов данных для классификации для получения информации о связанных опциях.

Link to this sectionКак MNIST соотносится с другими наборами данных для классификации изображений?#

MNIST проще, чем многие современные наборы данных, такие как CIFAR-10 или ImageNet, что делает его идеальным для новичков и быстрой проверки идей. Хотя более сложные наборы данных предлагают большие вызовы из-за наличия цветных изображений и разнообразных категорий объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и историческому значению в развитии алгоритмов машинного обучения. Для более сложной замены с той же структурой см. Fashion-MNIST, где вместо цифр представлены предметы одежды.

Участники

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Создано 12 нояб. 2023 г.Обновлено вчера