No license

Link to this sectionDataset MNIST#

Name: MNIST Image Classification Dataset
Creator: Yann LeCun
Keywords: MNIST, conjunto de datos, dígitos escritos a mano, clasificación de imágenes, deep learning, aprendizaje automático, conjunto de entrenamiento, conjunto de prueba, NIST

El conjunto de datos MNIST (Modified National Institute of Standards and Technology) es un punto de referencia de clasificación de imágenes de 70 000 imágenes en escala de grises de 28x28 de dígitos escritos a mano que abarcan 10 clases: los dígitos del 0 al 9. Se suministra con una división predefinida de 60 000 imágenes de entrenamiento y 10 000 de prueba, y durante mucho tiempo ha servido como estándar de referencia para evaluar algoritmos de aprendizaje automático y visión artificial. Para el equivalente más difícil con imágenes de ropa, consulta el conjunto de datos relacionado Fashion-MNIST; para imágenes en color, consulta CIFAR-10.

Link to this sectionCaracterísticas clave#

MNIST contiene 60 000 imágenes de entrenamiento y 10 000 imágenes de prueba de dígitos escritos a mano, para un total de 70 000.
Cada imagen es una fotografía en escala de grises de 28x28 de un solo dígito, normalizada y con suavizado (anti-aliasing) dentro de un cuadro delimitador fijo de 28x28.
Las 10 clases abarcan los dígitos 0-9, con un número de imágenes por clase aproximadamente equilibrado.
Se suministra con una división de entrenamiento/prueba predefinida, por lo que no es necesaria ninguna división manual o automática.
MNIST es un punto de referencia estándar para la clasificación de imágenes y la investigación en aprendizaje profundo.

Link to this sectionEstructura del dataset#

MNIST se suministra con una división oficial predefinida, por lo que no se necesita ninguna partición manual o automática:

Clases: 10 (dígitos escritos a mano 0–9)
Total de imágenes: 70.000 (28x28 escala de grises)
Conjunto de entrenamiento: 60 000 imágenes
Conjunto de prueba: 10 000 imágenes

División de validación

MNIST no tiene una carpeta de validación separada, por lo que Ultralytics utiliza el conjunto de prueba de 10 000 imágenes como división de validación durante el entrenamiento de forma predeterminada.

Cada imagen está etiquetada con su dígito correspondiente (0-9), lo que convierte a MNIST en un conjunto de datos supervisado ideal para tareas de clasificación.

Link to this sectionAplicaciones#

MNIST se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes, desde las clásicas redes neuronales convolucionales (CNN) y máquinas de vectores de soporte (SVM) hasta arquitecturas profundas modernas. Sus pequeñas imágenes en escala de grises y sus 10 clases de dígitos lo convierten en un punto de referencia rápido y reproducible para la comparación de algoritmos y la experimentación en visión artificial.

Algunas aplicaciones comunes incluyen:

Evaluación comparativa de nuevos algoritmos de clasificación
Propósitos educativos para enseñar conceptos de aprendizaje automático
Creación de prototipos de sistemas de reconocimiento de imágenes
Prueba de técnicas de optimización de modelos

Link to this sectionUso#

Entrena un modelo de clasificación YOLO en MNIST durante 100 épocas con un tamaño de imagen de 28. El conjunto de datos se descarga y almacena en caché automáticamente en el primer uso; si prefieres un control total sobre el preprocesamiento, los archivos gzip originales también están disponibles en la base de datos MNIST. Para obtener la lista completa de argumentos disponibles, consulta la página de Entrenamiento y la guía de tareas de clasificación de imágenes.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Pruebas rápidas con MNIST160

Ultralytics también expone data="mnist160", un fragmento de 160 imágenes que contiene las primeras ocho imágenes de cada dígito (0-9) tanto de las divisiones de entrenamiento como de prueba. Refleja la estructura de directorios de MNIST, por lo que puedes intercambiar conjuntos de datos sin cambiar ningún otro argumento: ideal para canalizaciones de CI o comprobaciones de integridad antes de comprometerse con el conjunto de datos completo de 70 000 imágenes.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionMuestras de imágenes y anotaciones#

Imágenes de muestra del conjunto de datos MNIST:

Muestras del conjunto de datos de clasificación de dígitos escritos a mano MNIST

Las muestras muestran el rango de estilos de escritura a mano que el conjunto de datos captura a través de las 10 clases de dígitos.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos MNIST en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Nos gustaría agradecer a Yann LeCun, Corinna Cortes y Christopher J.C. Burges por crear y mantener el conjunto de datos MNIST como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos MNIST y sus creadores, visita el sitio web del conjunto de datos MNIST.

Link to this sectionFAQ#

Link to this section¿Qué es el conjunto de datos MNIST y por qué es importante en el aprendizaje automático?#

El conjunto de datos MNIST es un punto de referencia de 70 000 imágenes en escala de grises de 28x28 de dígitos escritos a mano, divididas en 60 000 imágenes de entrenamiento y 10 000 de prueba en las 10 clases del 0 al 9. Es la referencia estándar para evaluar algoritmos de clasificación de imágenes: su formato pequeño y uniforme permite a investigadores e ingenieros comparar métodos y realizar un seguimiento del progreso con una configuración mínima, razón por la cual sigue siendo un primer punto de referencia común en el aprendizaje automático.

Link to this section¿Cuántas clases e imágenes tiene el conjunto de datos MNIST?#

MNIST tiene 10 clases (los dígitos escritos a mano del 0 al 9) y 70 000 imágenes en escala de grises en total, cada una de 28x28 píxeles. Se suministra con una división predefinida de 60 000 imágenes de entrenamiento y 10 000 de prueba, con un número aproximadamente igual de ejemplos por dígito.

Link to this section¿Cómo puedo utilizar Ultralytics YOLO para entrenar un modelo con el conjunto de datos MNIST?#

Para entrenar un modelo Ultralytics YOLO en MNIST, utiliza los fragmentos de código a continuación. El conjunto de datos se descarga automáticamente en el primer uso. Para obtener una lista detallada de los argumentos de entrenamiento disponibles, consulta la página de Entrenamiento.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this section¿Cómo se divide el conjunto de datos MNIST en conjuntos de entrenamiento y prueba?#

MNIST se suministra con una división predefinida de 60 000 imágenes de entrenamiento y 10 000 de prueba. A diferencia de los conjuntos de datos de clasificación basados en carpetas que Ultralytics divide automáticamente, la partición oficial de MNIST se utiliza tal cual, y el conjunto de prueba sirve como división de validación durante el entrenamiento de forma predeterminada.

Link to this section¿Cuál es la diferencia entre los conjuntos de datos MNIST y EMNIST?#

El conjunto de datos MNIST contiene solo dígitos escritos a mano, mientras que el conjunto de datos EMNIST (Extended MNIST) incluye tanto dígitos como letras mayúsculas y minúsculas. EMNIST se desarrolló como sucesor de MNIST y utiliza el mismo formato de 28x28 píxeles, lo que lo hace compatible con herramientas y modelos diseñados para el conjunto de datos MNIST original. Esta gama más amplia de caracteres hace que EMNIST sea útil para una mayor variedad de aplicaciones de aprendizaje automático.

Link to this section¿Puedo utilizar Ultralytics Platform para entrenar modelos en conjuntos de datos como MNIST?#

Sí. Ultralytics Platform te permite subir conjuntos de datos, entrenar modelos de clasificación de imágenes y desplegarlos sin necesidad de programar demasiado. Es una forma cómoda de ejecutar experimentos de MNIST en la nube; consulta la descripción general de conjuntos de datos de clasificación para ver opciones relacionadas.

Link to this section¿Cómo se compara MNIST con otros conjuntos de datos de clasificación de imágenes?#

MNIST es más sencillo que muchos conjuntos de datos modernos como CIFAR-10 o ImageNet, lo que lo hace ideal para principiantes y para experimentos rápidos. Aunque los conjuntos de datos más complejos ofrecen mayores retos con imágenes en color y diversas categorías de objetos, MNIST sigue siendo valioso por su sencillez, su pequeño tamaño de archivo y su importancia histórica en el desarrollo de algoritmos de aprendizaje automático. Para un reemplazo más difícil con la misma estructura, consulta Fashion-MNIST, que presenta artículos de ropa en lugar de dígitos.

Colaboradores

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Creado 12 nov 2023Actualizado ayer