Ir al contenido

Conjunto de datos MNIST

El conjunto de datos MNIST (Modified National Institute of Standards and Technology) es una gran base de datos de dígitos manuscritos que se utiliza habitualmente para entrenar diversos sistemas de procesamiento de imágenes y modelos de aprendizaje automático. Se creó "remezclando" las muestras de los conjuntos de datos originales del NIST y se ha convertido en una referencia para evaluar el rendimiento de los algoritmos de clasificación de imágenes.

Características principales

  • MNIST contiene 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba de dígitos manuscritos.
  • El conjunto de datos incluye imágenes en escala de grises de 28x28 píxeles.
  • Las imágenes se normalizan para que quepan en un cuadro delimitador de 28x28 píxeles y se suavizan introduciendo niveles de escala de grises.
  • MNIST se utiliza ampliamente para entrenamiento y pruebas en el campo del aprendizaje automático, especialmente para tareas de clasificación de imágenes.

Estructura del conjunto de datos

El conjunto de datos MNIST se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 60.000 imágenes de dígitos manuscritos utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de pruebas: Este subconjunto consta de 10.000 imágenes utilizadas para probar y evaluar los modelos entrenados.

MNIST ampliado (EMNIST)

El MNIST ampliado (EMNIST) es un nuevo conjunto de datos desarrollado y publicado por el NIST como sucesor del MNIST. Mientras que MNIST sólo incluía imágenes de dígitos manuscritos, EMNIST incluye todas las imágenes de la base de datos especial 19 del NIST, que es una gran base de datos de letras mayúsculas y minúsculas manuscritas, así como de dígitos. Las imágenes de EMNIST se convirtieron al mismo formato de 28x28 píxeles, mediante el mismo proceso, que las imágenes de MNIST. Por consiguiente, las herramientas que funcionan con el conjunto de datos MNIST, más antiguo y más pequeño, probablemente funcionarán sin modificaciones con EMNIST.

Aplicaciones

El conjunto de datos MNIST se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. El formato sencillo y bien estructurado del conjunto de datos lo convierte en un recurso esencial para investigadores y profesionales del campo del aprendizaje automático y la visión por ordenador.

Utilización

Para entrenar un modelo CNN en el conjunto de datos MNIST durante 100 épocas con un tamaño de imagen de 32x32, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Ejemplos de imágenes y anotaciones

El conjunto de datos MNIST contiene imágenes en escala de grises de dígitos manuscritos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Estos son algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y complejidad de los dígitos manuscritos en el conjunto de datos MNIST, lo que pone de relieve la importancia de contar con un conjunto de datos diverso para entrenar modelos sólidos de clasificación de imágenes.

Citas y agradecimientos

Si utiliza el conjunto de datos MNIST en su

trabajo de investigación o desarrollo, cite el siguiente documento:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Queremos dar las gracias a Yann LeCun, Corinna Cortes y Christopher J.C. Burges por crear y mantener el conjunto de datos MNIST como un valioso recurso para la comunidad de investigadores del aprendizaje automático y la visión por ordenador. Para obtener más información sobre el conjunto de datos MNIST y sus creadores, visite el sitio web del conjunto de datos MNIST.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos MNIST y por qué es importante en el aprendizaje automático?

El conjunto de datos MNIST, o Modified National Institute of Standards and Technology dataset, es una colección muy utilizada de dígitos manuscritos diseñada para entrenar y probar sistemas de clasificación de imágenes. Incluye 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba, todas ellas en escala de grises y con un tamaño de 28x28 píxeles. La importancia de este conjunto de datos radica en su papel como referencia estándar para evaluar algoritmos de clasificación de imágenes, lo que ayuda a investigadores e ingenieros a comparar métodos y seguir los avances en este campo.

¿Cómo puedo utilizar Ultralytics YOLO para entrenar un modelo en el conjunto de datos MNIST?

Para entrenar un modelo en el conjunto de datos MNIST utilizando Ultralytics YOLO , puede seguir estos pasos:

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Para obtener una lista detallada de los argumentos de formación disponibles, consulte la página Formación.

¿Cuál es la diferencia entre los conjuntos de datos MNIST y EMNIST?

El conjunto de datos MNIST sólo contiene dígitos manuscritos, mientras que el conjunto de datos MNIST ampliado (EMNIST) incluye tanto dígitos como letras mayúsculas y minúsculas. EMNIST se desarrolló como sucesor de MNIST y utiliza el mismo formato de 28x28 píxeles para las imágenes, lo que lo hace compatible con herramientas y modelos diseñados para el conjunto de datos MNIST original. Esta gama más amplia de caracteres en EMNIST hace que sea útil para una mayor variedad de aplicaciones de aprendizaje automático.

¿Puedo utilizar Ultralytics HUB para entrenar modelos en conjuntos de datos personalizados como MNIST?

Sí, puede utilizar Ultralytics HUB para entrenar modelos en conjuntos de datos personalizados como MNIST. Ultralytics HUB ofrece una interfaz fácil de usar para cargar conjuntos de datos, entrenar modelos y gestionar proyectos sin necesidad de tener amplios conocimientos de codificación. Para obtener más información sobre cómo empezar, consulte la página de inicio rápido deUltralytics HUB.

Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios