Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных MNIST#

Набор данных MNIST (Modified National Institute of Standards and Technology) — это обширная база данных рукописных цифр, которая обычно используется для обучения различных систем обработки изображений и моделей машинного обучения. Он был создан путем «перемешивания» образцов из оригинальных наборов данных NIST и стал эталоном для оценки производительности алгоритмов классификации изображений.

Link to this sectionКлючевые особенности#

  • MNIST содержит 60 000 обучающих и 10 000 тестовых изображений рукописных цифр.
  • Набор данных включает изображения в оттенках серого размером 28×28 пикселей.
  • Изображения нормализованы так, чтобы вписываться в bounding box 28×28 пикселей, и сглажены, что добавляет уровни яркости серого.
  • MNIST широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.

Link to this sectionСтруктура набора данных#

Набор данных MNIST разделен на два подмножества:

  1. Обучающая выборка (Training Set): Это подмножество содержит 60 000 изображений рукописных цифр, используемых для обучения моделей машинного обучения.
  2. Тестовая выборка (Testing Set): Это подмножество состоит из 10 000 изображений, используемых для тестирования и оценки обученных моделей.

Link to this sectionДоступ к набору данных#

  • Оригинальные файлы: Скачай gzip-архивы из оригинального архива MNIST, если хочешь напрямую управлять предобработкой.
  • Загрузчик Ultralytics: Используй data="mnist" (или data="mnist160" для подмножества ниже) в своей команде, и набор данных будет автоматически скачан, преобразован в PNG и кэширован.

Каждое изображение в наборе данных помечено соответствующей цифрой (0-9), что делает его набором данных для обучения с учителем, идеально подходящим для задач классификации.

Link to this sectionРасширенный MNIST (EMNIST)#

Расширенный MNIST (EMNIST) — это более новый набор данных, разработанный и выпущенный NIST в качестве преемника MNIST. В то время как MNIST включал изображения только рукописных цифр, EMNIST включает все изображения из NIST Special Database 19, что представляет собой большую базу данных рукописных прописных и строчных букв, а также цифр. Изображения в EMNIST были преобразованы в тот же формат 28×28 пикселей по тому же процессу, что и изображения MNIST. Соответственно, инструменты, работающие со старым, меньшим набором данных MNIST, скорее всего, будут работать с EMNIST без изменений.

Link to this sectionПрименение#

Набор данных MNIST широко используется для обучения и оценки моделей глубинного обучения в задачах классификации изображений, таких как сверточные нейронные сети (CNN), методы опорных векторов (SVM) и различные другие алгоритмы машинного обучения. Простой и хорошо структурированный формат набора данных делает его важным ресурсом для исследователей и практиков в области машинного обучения и компьютерного зрения.

Некоторые распространенные приложения включают:

  • Тестирование новых алгоритмов классификации
  • Образовательные цели для обучения концепциям машинного обучения
  • Прототипирование систем распознавания изображений
  • Тестирование методов оптимизации моделей

Link to this sectionИспользование#

Чтобы обучить модель CNN на наборе данных MNIST в течение 100 эпох с размером изображения 28×28, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionПримеры изображений и аннотации#

Набор данных MNIST содержит изображения рукописных цифр в оттенках серого, предоставляя хорошо структурированный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Примеры набора данных классификации рукописных цифр MNIST

Этот пример демонстрирует разнообразие и сложность рукописных цифр в наборе данных MNIST, подчеркивая важность разнообразного набора данных для обучения надежных моделей классификации изображений.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных MNIST в своей исследовательской или проектной работе, пожалуйста, укажи следующую статью:

Цитата
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Мы хотели бы выразить признательность Янну Лекуну, Коринне Кортес и Кристоферу Дж. К. Берджесу за создание и поддержку набора данных MNIST в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных MNIST и его создателях посети сайт набора данных MNIST.

Link to this sectionБыстрые тесты MNIST160#

Нужен молниеносно быстрый регрессионный тест? Ultralytics также предоставляет data="mnist160", срез из 160 изображений, содержащий первые восемь изображений каждой цифры (0-9) как из обучающей, так и из тестовой выборок. Он повторяет структуру каталогов MNIST, поэтому ты можешь менять наборы данных, не меняя никаких других аргументов:

Пример обучения с MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Используй это подмножество для CI-конвейеров или проверок работоспособности перед тем, как переходить к полному набору данных из 70 000 изображений.

Link to this sectionFAQ#

Link to this sectionЧто такое набор данных MNIST и почему он важен в машинном обучении?#

Набор данных MNIST, или Modified National Institute of Standards and Technology, — это широко используемая коллекция рукописных цифр, предназначенная для обучения и тестирования систем классификации изображений. Он включает 60 000 обучающих и 10 000 тестовых изображений, все из которых являются изображениями в оттенках серого размером 28×28 пикселей. Важность этого набора данных заключается в его роли стандартного эталона для оценки алгоритмов классификации изображений, помогая исследователям и инженерам сравнивать методы и отслеживать прогресс в этой области.

Link to this sectionКак я могу использовать Ultralytics YOLO для обучения модели на наборе данных MNIST?#

Чтобы обучить модель на наборе данных MNIST с помощью Ultralytics YOLO, ты можешь выполнить следующие шаги:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Для получения подробного списка доступных аргументов обучения обратись к странице обучения.

Link to this sectionВ чем разница между наборами данных MNIST и EMNIST?#

Набор данных MNIST содержит только рукописные цифры, тогда как набор данных Extended MNIST (EMNIST) включает как цифры, так и прописные и строчные буквы. EMNIST был разработан как преемник MNIST и использует тот же формат изображений 28×28 пикселей, что делает его совместимым с инструментами и моделями, разработанными для оригинального набора данных MNIST. Этот более широкий набор символов в EMNIST делает его полезным для более разнообразных приложений машинного обучения.

Link to this sectionМогу ли я использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST?#

Да, ты можешь использовать платформу Ultralytics для обучения моделей на пользовательских наборах данных, таких как MNIST. Платформа Ultralytics предлагает удобный интерфейс для загрузки наборов данных, обучения моделей и управления проектами без необходимости обширных знаний в программировании. Для получения дополнительных сведений о том, как начать работу, ознакомься со страницей быстрого запуска платформы Ultralytics.

Link to this sectionКак MNIST соотносится с другими наборами данных для классификации изображений?#

MNIST проще, чем многие современные наборы данных, такие как CIFAR-10 или ImageNet, что делает его идеальным для начинающих и для быстрых экспериментов. Хотя более сложные наборы данных предлагают большие проблемы с цветными изображениями и разнообразными категориями объектов, MNIST остается ценным благодаря своей простоте, небольшому размеру файлов и исторической значимости в развитии алгоритмов машинного обучения. Для более продвинутых задач классификации рассмотри использование Fashion-MNIST, который сохраняет ту же структуру, но содержит предметы одежды вместо цифр.

Комментарии