Saltar al contenido

Conjunto de datos Moda-MNIST

El conjunto de datos Moda-MNIST es una base de datos de imágenes de artículos de Zalando que consta de un conjunto de entrenamiento de 60.000 ejemplos y un conjunto de prueba de 10.000 ejemplos. Cada ejemplo es una imagen en escala de grises de 28x28, asociada a una etiqueta de entre 10 clases. El objetivo de Fashion-MNIST es sustituir directamente al conjunto de datos MNIST original para evaluar algoritmos de aprendizaje automático.



Observa: Cómo hacer la Clasificación de Imágenes en el Conjunto de Datos MNIST de Moda utilizando Ultralytics YOLOv8

Características principales

  • Fashion-MNIST contiene 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba de imágenes de artículos de Zalando.
  • El conjunto de datos consta de imágenes en escala de grises de tamaño 28x28 píxeles.
  • Cada píxel tiene asociado un único valor de píxel, que indica la claridad u oscuridad de ese píxel, y los números más altos significan más oscuro. Este valor de píxel es un número entero comprendido entre 0 y 255.
  • Fashion-MNIST se utiliza ampliamente para entrenar y probar en el campo del aprendizaje automático, especialmente para tareas de clasificación de imágenes.

Estructura del conjunto de datos

El conjunto de datos Moda-MNIST se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 60.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de pruebas: Este subconjunto consta de 10.000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Etiquetas

A cada ejemplo de entrenamiento y de prueba se le asigna una de las siguientes etiquetas:

  1. Camiseta/top
  2. Pantalones
  3. Jersey
  4. Vestido
  5. Abrigo
  6. Sandalia
  7. Camisa
  8. Zapatilla
  9. Bolsa
  10. Botín

Aplicaciones

El conjunto de datos Moda-MNIST se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. El formato sencillo y bien estructurado del conjunto de datos lo convierte en un recurso esencial para investigadores y profesionales del campo del aprendizaje automático y la visión por ordenador.

Utilización

Para entrenar un modelo CNN en el conjunto de datos Moda-MNIST durante 100 épocas con un tamaño de imagen de 28x28, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Ejemplos de imágenes y anotaciones

El conjunto de datos Moda-MNIST contiene imágenes en escala de grises de las imágenes de los artículos de Zalando, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos Moda-MNIST, lo que pone de relieve la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.

Agradecimientos

Si utilizas el conjunto de datos Moda-MNIST en tu trabajo de investigación o desarrollo, por favor, reconoce el conjunto de datos enlazando al repositorio GitHub. Este conjunto de datos ha sido facilitado por Zalando Research.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos Moda-MNIST y en qué se diferencia de MNIST?

El conjunto de datos Moda-MNIST es una colección de 70.000 imágenes en escala de grises de imágenes de artículos de Zalando, que pretende ser un sustituto moderno del conjunto de datos MNIST original. Sirve como punto de referencia para los modelos de aprendizaje automático en el contexto de las tareas de clasificación de imágenes. A diferencia de MNIST, que contiene dígitos escritos a mano, Fashion-MNIST consta de imágenes de 28x28 píxeles clasificadas en 10 clases relacionadas con la moda, como camiseta/top, pantalón y botín.

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Moda-MNIST?

Para entrenar un modelo Ultralytics YOLO en el conjunto de datos Moda-MNIST, puedes utilizar los comandos Python y CLI . Aquí tienes un ejemplo rápido para empezar:

Ejemplo de tren

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Para obtener más detalles sobre los parámetros de entrenamiento, consulta la página Entrenamiento.

¿Por qué debería utilizar el conjunto de datos Fashion-MNIST para evaluar mis modelos de aprendizaje automático?

El conjunto de datos Fashion-MNIST está ampliamente reconocido en la comunidad del aprendizaje profundo como una alternativa sólida a MNIST. Ofrece un conjunto de imágenes más complejo y variado, lo que lo convierte en una opción excelente para evaluar modelos de clasificación de imágenes. La estructura del conjunto de datos, que comprende 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba, cada una etiquetada con una de 10 clases, lo hace ideal para evaluar el rendimiento de diferentes algoritmos de aprendizaje automático en un contexto más desafiante.

¿Puedo utilizar Ultralytics YOLO para tareas de clasificación de imágenes como Fashion-MNIST?

Sí, los modelos Ultralytics YOLO pueden utilizarse para tareas de clasificación de imágenes, incluidas las del conjunto de datos Moda-MNIST. YOLOv8, por ejemplo, admite diversas tareas de visión, como la detección, la segmentación y la clasificación. Para empezar con las tareas de clasificación de imágenes, consulta la página Clasificación.

¿Cuáles son las características clave y la estructura del conjunto de datos Moda-MNIST?

El conjunto de datos Moda-MNIST se divide en dos subconjuntos principales: 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba. Cada imagen es una imagen en escala de grises de 28x28 píxeles que representa una de las 10 clases relacionadas con la moda. Su sencillez y su formato bien estructurado lo hacen ideal para entrenar y evaluar modelos en tareas de aprendizaje automático y visión por ordenador. Para más detalles sobre la estructura del conjunto de datos, consulta la sección Estructura del conjunto de datos.

¿Cómo puedo reconocer el uso del conjunto de datos Fashion-MNIST en mi investigación?

Si utilizas el conjunto de datos Fashion-MNIST en tus proyectos de investigación o desarrollo, es importante que lo reconozcas mediante un enlace al repositorio de GitHub. Esto ayuda a atribuir los datos a Zalando Research, que puso el conjunto de datos a disposición del uso público.



Creado 2023-11-12, Actualizado 2024-07-04
Autores: glenn-jocher (5), RizwanMunawar (1)

Comentarios