Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных MNIST#

Набор данных MNIST (Modified National Institute of Standards and Technology) представляет собой обширную базу рукописных цифр, которая широко используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем «перемешивания» образцов из оригинальных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.

Link to this sectionКлючевые особенности#

  • MNIST содержит 60 000 обучающих и 10 000 тестовых изображений рукописных цифр.
  • Набор данных состоит из полутоновых изображений размером 28×28 пикселей.
  • Изображения нормализованы так, чтобы помещаться в bounding box 28×28 пикселей, и сглажены (anti-aliased), что добавляет уровни серого.
  • MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.

Link to this sectionСтруктура набора данных#

Набор данных MNIST разделен на два подмножества:

  1. Обучающий набор: это подмножество содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
  2. Тестовый набор: это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Link to this sectionДоступ к набору данных#

  • Оригинальные файлы: скачай gzip-архивы из оригинального архива MNIST, если тебе нужен прямой контроль над предобработкой.
  • Загрузчик Ultralytics: используй data="mnist" (или data="mnist160" для подмножества ниже) в своей команде, и набор данных будет автоматически загружен, конвертирован в PNG и закеширован.

Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его набором данных для обучения с учителем, идеально подходящим для задач классификации.

Link to this sectionРасширенный MNIST (EMNIST)#

Расширенный MNIST (EMNIST) — это более новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включал изображения только рукописных цифр, EMNIST содержит все изображения из NIST Special Database 19, представляющей собой большую базу данных рукописных заглавных и строчных букв, а также цифр. Изображения в EMNIST были конвертированы в тот же формат 28×28 пикселей по тому же процессу, что и изображения MNIST. Соответственно, инструменты, работающие со старым, меньшим набором данных MNIST, скорее всего, будут работать с EMNIST без модификаций.

Link to this sectionПрименение#

Набор данных MNIST широко используется для обучения и оценки моделей глубинного обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), метод опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Простой и хорошо структурированный формат набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.

Некоторые распространенные области применения:

  • Сравнительное тестирование новых алгоритмов классификации
  • Образовательные цели для обучения концепциям машинного обучения
  • Прототипирование систем распознавания изображений
  • Тестирование методов оптимизации моделей

Link to this sectionИспользование#

Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 28×28, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionПримеры изображений и аннотации#

Набор данных MNIST содержит полутоновые изображения рукописных цифр, предоставляя хорошо структурированные данные для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образцы набора данных классификации рукописных цифр MNIST

Пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных MNIST в своей исследовательской или разработческой работе, пожалуйста, сошлися на следующую публикацию:

Цитата
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Мы хотели бы выразить признательность Янну Лекуну, Коринне Кортес и Кристоферу Дж.К. Берджесу за создание и поддержку набора данных MNIST в качестве ценного ресурса для сообщества исследователей в области машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети веб-сайт набора данных MNIST.

Link to this sectionБыстрые тесты MNIST160#

Нужен молниеносный регрессионный тест? Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий первые восемь изображений каждой цифры (0-9) как из обучающей, так и из тестовой выборок. Он повторяет структуру каталогов MNIST, поэтому ты можешь менять наборы данных, не меняя никаких других аргументов:

Пример обучения с MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Используй это подмножество для CI-конвейеров или проверки работоспособности перед фиксацией изменений для полного набора данных из 70 000 изображений.

Link to this sectionFAQ#

Link to this sectionЧто такое набор данных MNIST и почему он важен в машинном обучении?#

Набор данных MNIST, или набор данных Modified National Institute of Standards and Technology, представляет собой широко используемую коллекцию рукописных цифр, предназначенную для обучения и тестирования систем классификации изображений. Он включает 60 000 обучающих и 10 000 тестовых изображений, все из которых являются полутоновыми и имеют размер 28×28 пикселей. Важность этого набора данных заключается в его роли в качестве стандартного эталона для оценки алгоритмов классификации изображений, что помогает исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.

Link to this sectionКак я могу использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?#

Чтобы обучить модель на наборе данных MNIST с помощью Ultralytics YOLO, ты можешь выполнить следующие шаги:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Для получения подробного списка доступных аргументов обучения обратись к странице обучения.

Link to this sectionВ чем разница между наборами данных MNIST и EMNIST?#

Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и заглавные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат изображения 28×28 пикселей, что делает его совместимым с инструментами и моделями, разработанными для оригинального набора данных MNIST. Этот более широкий набор символов в EMNIST делает его полезным для более разнообразных задач машинного обучения.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST?#

Да, ты можешь использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST. Платформа Ultralytics предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости глубоких знаний в программировании. Для получения дополнительной информации о том, как начать, посети страницу быстрого запуска платформы Ultralytics.

Link to this sectionКак MNIST соотносится с другими наборами данных для классификации изображений?#

MNIST проще многих современных наборов данных, таких как CIFAR-10 или ImageNet, что делает его идеальным для новичков и быстрых экспериментов. Хотя более сложные наборы данных предлагают более серьезные задачи с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и историческому значению в развитии алгоритмов машинного обучения. Для более продвинутых задач классификации рассмотри возможность использования Fashion-MNIST, который поддерживает ту же структуру, но содержит изображения предметов одежды вместо цифр.

Комментарии