Link to this sectionDataset MNIST#
El conjunto de datos MNIST (Modified National Institute of Standards and Technology) es una gran base de datos de dígitos escritos a mano que se utiliza habitualmente para entrenar diversos sistemas de procesamiento de imágenes y modelos de aprendizaje automático. Fue creado mediante la «recombinación» de muestras de los conjuntos de datos originales del NIST y se ha convertido en un punto de referencia para evaluar el rendimiento de los algoritmos de clasificación de imágenes.
Link to this sectionCaracterísticas clave#
- MNIST contiene 60 000 imágenes de entrenamiento y 10 000 imágenes de prueba de dígitos escritos a mano.
- El conjunto de datos comprende imágenes en escala de grises de 28×28 píxeles de tamaño.
- Las imágenes están normalizadas para ajustarse a un bounding box de 28×28 píxeles y tienen antialiasing, lo que introduce niveles de escala de grises.
- MNIST se utiliza ampliamente para el entrenamiento y las pruebas en el campo del aprendizaje automático, especialmente para tareas de clasificación de imágenes.
Link to this sectionEstructura del dataset#
El conjunto de datos MNIST se divide en dos subconjuntos:
- Conjunto de entrenamiento: este subconjunto contiene 60 000 imágenes de dígitos escritos a mano utilizadas para entrenar modelos de aprendizaje automático.
- Conjunto de prueba: este subconjunto consta de 10 000 imágenes utilizadas para probar y evaluar los modelos entrenados.
Link to this sectionAcceso al conjunto de datos#
- Archivos originales: descarga los archivos gzip del archivo original de MNIST si deseas un control directo sobre el preprocesamiento.
- Cargador de Ultralytics: utiliza
data="mnist"(odata="mnist160"para el subconjunto de abajo) en tu comando y el conjunto de datos se descargará, convertirá a PNG y almacenará en caché automáticamente.
Cada imagen del conjunto de datos está etiquetada con el dígito correspondiente (0-9), lo que lo convierte en un conjunto de datos de aprendizaje supervisado ideal para tareas de clasificación.
Link to this sectionMNIST extendido (EMNIST)#
El MNIST extendido (EMNIST) es un conjunto de datos más reciente desarrollado y publicado por el NIST para ser el sucesor de MNIST. Mientras que MNIST incluía solo imágenes de dígitos escritos a mano, EMNIST incluye todas las imágenes de la base de datos especial 19 del NIST, que es una gran base de datos de letras mayúsculas y minúsculas escritas a mano, así como de dígitos. Las imágenes en EMNIST se convirtieron al mismo formato de 28×28 píxeles, mediante el mismo proceso, que las imágenes MNIST. En consecuencia, es probable que las herramientas que funcionan con el conjunto de datos MNIST original, más pequeño, funcionen sin modificaciones con EMNIST.
Link to this sectionAplicaciones#
El conjunto de datos MNIST se utiliza ampliamente para entrenar y evaluar modelos de deep learning en tareas de clasificación de imágenes, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros diversos algoritmos de aprendizaje automático. El formato simple y bien estructurado del conjunto de datos lo convierte en un recurso esencial para investigadores y profesionales en el campo del aprendizaje automático y la visión artificial.
Algunas aplicaciones comunes incluyen:
- Evaluación comparativa de nuevos algoritmos de clasificación
- Propósitos educativos para enseñar conceptos de aprendizaje automático
- Creación de prototipos de sistemas de reconocimiento de imágenes
- Prueba de técnicas de optimización de modelos
Link to this sectionUso#
Para entrenar un modelo CNN en el conjunto de datos MNIST durante 100 epochs con un tamaño de imagen de 28×28, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionMuestras de imágenes y anotaciones#
El conjunto de datos MNIST contiene imágenes en escala de grises de dígitos escritos a mano, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Estos son algunos ejemplos de imágenes del conjunto de datos:

El ejemplo muestra la variedad y complejidad de los dígitos escritos a mano en el conjunto de datos MNIST, destacando la importancia de contar con un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.
Link to this sectionCitas y agradecimientos#
Si utilizas el conjunto de datos MNIST en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Nos gustaría expresar nuestro agradecimiento a Yann LeCun, Corinna Cortes y Christopher J.C. Burges por crear y mantener el conjunto de datos MNIST como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos MNIST y sus creadores, visita el sitio web del conjunto de datos MNIST.
Link to this sectionPruebas rápidas MNIST160#
¿Necesitas una prueba de regresión extremadamente rápida? Ultralytics también expone data="mnist160", un fragmento de 160 imágenes que contiene las ocho primeras imágenes de cada dígito (0-9) tanto de las divisiones de entrenamiento como de las de prueba. Refleja la estructura de directorios de MNIST, por lo que puedes intercambiar conjuntos de datos sin cambiar ningún otro argumento:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Utiliza este subconjunto para canalizaciones CI o comprobaciones de integridad antes de confirmar el conjunto de datos completo de 70 000 imágenes.
Link to this sectionFAQ#
Link to this section¿Qué es el conjunto de datos MNIST y por qué es importante en el aprendizaje automático?#
El conjunto de datos MNIST, o conjunto de datos del Modified National Institute of Standards and Technology, es una colección muy utilizada de dígitos escritos a mano diseñada para entrenar y probar sistemas de clasificación de imágenes. Incluye 60 000 imágenes de entrenamiento y 10 000 imágenes de prueba, todas ellas en escala de grises y con un tamaño de 28×28 píxeles. La importancia del conjunto de datos reside en su papel como punto de referencia estándar para evaluar algoritmos de clasificación de imágenes, ayudando a investigadores e ingenieros a comparar métodos y realizar un seguimiento del progreso en el campo.
Link to this section¿Cómo puedo utilizar Ultralytics YOLO para entrenar un modelo con el conjunto de datos MNIST?#
Para entrenar un modelo con el conjunto de datos MNIST utilizando Ultralytics YOLO, puedes seguir estos pasos:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Para obtener una lista detallada de los argumentos de entrenamiento disponibles, consulta la página de entrenamiento.
Link to this section¿Cuál es la diferencia entre los conjuntos de datos MNIST y EMNIST?#
El conjunto de datos MNIST contiene únicamente dígitos escritos a mano, mientras que el conjunto de datos MNIST extendido (EMNIST) incluye tanto dígitos como letras mayúsculas y minúsculas. EMNIST se desarrolló como sucesor de MNIST y utiliza el mismo formato de 28×28 píxeles para las imágenes, lo que lo hace compatible con herramientas y modelos diseñados para el conjunto de datos MNIST original. Esta gama más amplia de caracteres en EMNIST lo hace útil para una mayor variedad de aplicaciones de aprendizaje automático.
Link to this section¿Puedo utilizar la plataforma de Ultralytics para entrenar modelos con conjuntos de datos personalizados como MNIST?#
Sí, puedes utilizar Ultralytics Platform para entrenar modelos con conjuntos de datos personalizados como MNIST. Ultralytics Platform ofrece una interfaz fácil de usar para cargar conjuntos de datos, entrenar modelos y gestionar proyectos sin necesidad de amplios conocimientos de programación. Para obtener más información sobre cómo empezar, consulta la página de inicio rápido de la plataforma Ultralytics.
Link to this section¿Cómo se compara MNIST con otros conjuntos de datos de clasificación de imágenes?#
MNIST es más simple que muchos conjuntos de datos modernos como CIFAR-10 o ImageNet, lo que lo hace ideal para principiantes y para experimentaciones rápidas. Si bien conjuntos de datos más complejos ofrecen mayores desafíos con imágenes en color y diversas categorías de objetos, MNIST sigue siendo valioso por su simplicidad, pequeño tamaño de archivo y significado histórico en el desarrollo de algoritmos de aprendizaje automático. Para tareas de clasificación más avanzadas, considera utilizar Fashion-MNIST, que mantiene la misma estructura pero presenta artículos de ropa en lugar de dígitos.