Meet YOLO26: next-gen vision AI.

Link to this sectionDataset MNIST#

El dataset MNIST (Modified National Institute of Standards and Technology) es una gran base de datos de dígitos escritos a mano que se utiliza habitualmente para entrenar diversos sistemas de procesamiento de imágenes y modelos de aprendizaje automático. Se creó "remezclando" las muestras de los datasets originales del NIST y se ha convertido en un punto de referencia para evaluar el rendimiento de algoritmos de clasificación de imágenes.

Link to this sectionCaracterísticas clave#

  • MNIST contiene 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba de dígitos escritos a mano.
  • El dataset consta de imágenes en escala de grises de 28×28 píxeles de tamaño.
  • Las imágenes están normalizadas para ajustarse a una bounding box de 28×28 píxeles y suavizadas, introduciendo niveles de escala de grises.
  • MNIST se utiliza ampliamente para el entrenamiento y las pruebas en el campo del aprendizaje automático, especialmente para tareas de clasificación de imágenes.

Link to this sectionEstructura del dataset#

El dataset MNIST se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 60.000 imágenes de dígitos escritos a mano que se utilizan para entrenar modelos de aprendizaje automático.
  2. Conjunto de prueba: Este subconjunto consta de 10.000 imágenes que se utilizan para probar y evaluar los modelos entrenados.

Link to this sectionAcceso al dataset#

  • Archivos originales: Descarga los archivos gzip del archivo original de MNIST si deseas tener un control directo sobre el preprocesamiento.
  • Cargador de Ultralytics: Usa data="mnist" (o data="mnist160" para el subconjunto inferior) en tu comando y el dataset se descargará, convertirá a PNG y almacenará en caché automáticamente.

Cada imagen del dataset está etiquetada con el dígito correspondiente (0-9), lo que lo convierte en un dataset de aprendizaje supervisado ideal para tareas de clasificación.

Link to this sectionExtended MNIST (EMNIST)#

Extended MNIST (EMNIST) es un dataset más reciente desarrollado y publicado por el NIST para ser el sucesor de MNIST. Mientras que MNIST incluía imágenes solo de dígitos escritos a mano, EMNIST incluye todas las imágenes de la Special Database 19 del NIST, que es una gran base de datos de letras mayúsculas y minúsculas escritas a mano, así como dígitos. Las imágenes de EMNIST se convirtieron al mismo formato de 28×28 píxeles, mediante el mismo proceso, que las imágenes de MNIST. En consecuencia, las herramientas que funcionan con el dataset MNIST, más antiguo y pequeño, probablemente funcionarán sin modificaciones con EMNIST.

Link to this sectionAplicaciones#

El dataset MNIST se utiliza ampliamente para entrenar y evaluar modelos de deep learning en tareas de clasificación de imágenes, como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) y otros algoritmos de aprendizaje automático. El formato simple y bien estructurado del dataset lo convierte en un recurso esencial para investigadores y profesionales en el campo del machine learning y la computer vision.

Algunas aplicaciones comunes incluyen:

  • Evaluación de nuevos algoritmos de clasificación
  • Fines educativos para enseñar conceptos de aprendizaje automático
  • Creación de prototipos de sistemas de reconocimiento de imágenes
  • Prueba de técnicas de optimización de modelos

Link to this sectionUso#

Para entrenar un modelo CNN en el dataset MNIST durante 100 epochs con un tamaño de imagen de 28×28, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionMuestras de imágenes y anotaciones#

El dataset MNIST contiene imágenes en escala de grises de dígitos escritos a mano, proporcionando un dataset bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del dataset:

Muestras del dataset de clasificación de dígitos escritos a mano MNIST

El ejemplo muestra la variedad y complejidad de los dígitos escritos a mano en el dataset MNIST, destacando la importancia de contar con un dataset diverso para entrenar modelos robustos de clasificación de imágenes.

Link to this sectionCitas y agradecimientos#

Si utilizas el dataset MNIST en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Nos gustaría agradecer a Yann LeCun, Corinna Cortes y Christopher J.C. Burges por crear y mantener el dataset MNIST como un recurso valioso para la comunidad investigadora de aprendizaje automático y visión artificial. Para obtener más información sobre el dataset MNIST y sus creadores, visita el sitio web del dataset MNIST.

Link to this sectionPruebas rápidas con MNIST160#

¿Necesitas una prueba de regresión ultrarrápida? Ultralytics también expone data="mnist160", una muestra de 160 imágenes que contiene las ocho primeras imágenes de cada dígito (0-9) tanto de las particiones de entrenamiento como de prueba. Refleja la estructura de directorios de MNIST, por lo que puedes intercambiar datasets sin cambiar ningún otro argumento:

Ejemplo de entrenamiento con MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Utiliza este subconjunto para pipelines de CI o pruebas de integridad antes de comprometerte con el dataset completo de 70.000 imágenes.

Link to this sectionFAQ#

Link to this section¿Qué es el dataset MNIST y por qué es importante en el aprendizaje automático?#

El dataset MNIST, o Modified National Institute of Standards and Technology, es una colección muy utilizada de dígitos escritos a mano diseñada para entrenar y probar sistemas de clasificación de imágenes. Incluye 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba, todas en escala de grises y con un tamaño de 28×28 píxeles. La importancia del dataset reside en su papel como punto de referencia estándar para evaluar algoritmos de clasificación de imágenes, lo que ayuda a investigadores e ingenieros a comparar métodos y seguir el progreso en el campo.

Link to this section¿Cómo puedo usar Ultralytics YOLO para entrenar un modelo en el dataset MNIST?#

Para entrenar un modelo en el dataset MNIST usando Ultralytics YOLO, puedes seguir estos pasos:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Para obtener una lista detallada de los argumentos de entrenamiento disponibles, consulta la página de Entrenamiento.

Link to this section¿Cuál es la diferencia entre los datasets MNIST y EMNIST?#

El dataset MNIST contiene solo dígitos escritos a mano, mientras que el dataset Extended MNIST (EMNIST) incluye tanto dígitos como letras mayúsculas y minúsculas. EMNIST se desarrolló como sucesor de MNIST y utiliza el mismo formato de 28×28 píxeles para las imágenes, lo que lo hace compatible con herramientas y modelos diseñados para el dataset MNIST original. Este rango más amplio de caracteres en EMNIST lo hace útil para una variedad mayor de aplicaciones de aprendizaje automático.

Link to this section¿Puedo usar la Ultralytics Platform para entrenar modelos en datasets personalizados como MNIST?#

Sí, puedes usar Ultralytics Platform para entrenar modelos en datasets personalizados como MNIST. Ultralytics Platform ofrece una interfaz fácil de usar para cargar datasets, entrenar modelos y gestionar proyectos sin necesidad de amplios conocimientos de programación. Para obtener más detalles sobre cómo empezar, consulta la página de Guía de inicio rápido de la Ultralytics Platform.

Link to this section¿Cómo se compara MNIST con otros datasets de clasificación de imágenes?#

MNIST es más simple que muchos datasets modernos como CIFAR-10 o ImageNet, lo que lo hace ideal para principiantes y para realizar experimentos rápidos. Aunque datasets más complejos ofrecen mayores desafíos con imágenes en color y diversas categorías de objetos, MNIST sigue siendo valioso por su simplicidad, pequeño tamaño de archivo y significado histórico en el desarrollo de algoritmos de aprendizaje automático. Para tareas de clasificación más avanzadas, considera usar Fashion-MNIST, que mantiene la misma estructura pero presenta artículos de ropa en lugar de dígitos.

Comentarios