Conjunto de datos Fashion-MNIST
El conjunto de datos Fashion-MNIST es una base de datos de imágenes de artículos de Zalando, que consta de un conjunto de entrenamiento de 60,000 ejemplos y un conjunto de prueba de 10,000 ejemplos. Cada ejemplo es una imagen en escala de grises de 28x28, asociada con una etiqueta de 10 clases. Fashion-MNIST está diseñado para servir como un reemplazo directo del conjunto de datos MNIST original para la evaluación comparativa de algoritmos de aprendizaje automático.
Ver: Cómo hacerlo Clasificación de imágenes en el conjunto de datos Fashion MNIST utilizando Ultralytics YOLO11
Características clave
- Fashion-MNIST contiene 60,000 imágenes de entrenamiento y 10,000 imágenes de prueba de imágenes de artículos de Zalando.
- El conjunto de datos comprende imágenes en escala de grises de tamaño 28x28 píxeles.
- Cada píxel tiene un único valor asociado, que indica la claridad u oscuridad de ese píxel, siendo los números más altos los que indican mayor oscuridad. Este valor de píxel es un entero entre 0 y 255.
- Fashion-MNIST se utiliza ampliamente para el entrenamiento y las pruebas en el campo del aprendizaje automático, especialmente para las tareas de clasificación de imágenes.
Estructura del conjunto de datos
El conjunto de datos Fashion-MNIST se divide en dos subconjuntos:
- Conjunto de entrenamiento: Este subconjunto contiene 60.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
- Conjunto de Prueba: Este subconjunto consta de 10,000 imágenes utilizadas para probar y evaluar los modelos entrenados.
Etiquetas
Cada ejemplo de entrenamiento y prueba se asigna a una de las siguientes etiquetas:
0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot
Aplicaciones
El conjunto de datos Fashion-MNIST se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como Redes Neuronales Convolucionales (CNN), Máquinas de Vectores de Soporte (SVM) y varios otros algoritmos de aprendizaje automático. El formato simple y bien estructurado del conjunto de datos lo convierte en un recurso esencial para investigadores y profesionales en el campo del aprendizaje automático y la visión artificial.
Uso
Para entrenar un modelo CNN en el conjunto de datos Fashion-MNIST durante 100 épocas con un tamaño de imagen de 28x28, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.
Ejemplo de entrenamiento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28
sample_images y anotaciones
El conjunto de datos Fashion-MNIST contiene imágenes en escala de grises de imágenes de artículos de Zalando, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí hay algunos ejemplos de imágenes del conjunto de datos:
El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Fashion-MNIST, destacando la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.
Agradecimientos
Si utiliza el conjunto de datos Fashion-MNIST en su trabajo de investigación o desarrollo, reconozca el conjunto de datos enlazando al repositorio de GitHub. Este conjunto de datos fue puesto a disposición por Zalando Research.
Preguntas frecuentes
¿Qué es el conjunto de datos Fashion-MNIST y en qué se diferencia de MNIST?
El conjunto de datos Fashion-MNIST es una colección de 70.000 imágenes en escala de grises de imágenes de artículos de Zalando, destinado a ser un reemplazo moderno del conjunto de datos MNIST original. Sirve como un punto de referencia para los modelos de aprendizaje automático en el contexto de las tareas de clasificación de imágenes. A diferencia de MNIST, que contiene dígitos escritos a mano, Fashion-MNIST consta de imágenes de 28x28 píxeles clasificadas en 10 clases relacionadas con la moda, como camiseta/top, pantalón y botín.
¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Fashion-MNIST?
Para entrenar un modelo Ultralytics YOLO en el conjunto de datos Fashion-MNIST, puede utilizar comandos de python y CLI. Aquí hay un ejemplo rápido para comenzar:
Ejemplo de entrenamiento
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo11n-cls.pt")
# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Para obtener parámetros de entrenamiento más detallados, consulte la página de Entrenamiento.
¿Por qué debería utilizar el conjunto de datos Fashion-MNIST para evaluar mis modelos de aprendizaje automático?
El conjunto de datos Fashion-MNIST es ampliamente reconocido en la comunidad de aprendizaje profundo como una alternativa robusta a MNIST. Ofrece un conjunto de imágenes más complejo y variado, lo que lo convierte en una excelente opción para evaluar modelos de clasificación de imágenes. La estructura del conjunto de datos, que comprende 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba, cada una etiquetada con una de 10 clases, lo hace ideal para evaluar el rendimiento de diferentes algoritmos de aprendizaje automático en un contexto más desafiante.
¿Puedo usar Ultralytics YOLO para tareas de clasificación de imágenes como Fashion-MNIST?
Sí, los modelos Ultralytics YOLO se pueden utilizar para tareas de clasificación de imágenes, incluidas las que involucran el conjunto de datos Fashion-MNIST. YOLO11, por ejemplo, admite varias tareas de visión, como detección, segmentación y clasificación. Para comenzar con las tareas de clasificación de imágenes, consulte la página de Clasificación.
¿Cuáles son las características clave y la estructura del conjunto de datos Fashion-MNIST?
El conjunto de datos Fashion-MNIST se divide en dos subconjuntos principales: 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba. Cada imagen es una imagen en escala de grises de 28x28 píxeles que representa una de las 10 clases relacionadas con la moda. La simplicidad y el formato bien estructurado lo hacen ideal para entrenar y evaluar modelos en tareas de aprendizaje automático y visión artificial. Para obtener más detalles sobre la estructura del conjunto de datos, consulte la sección Estructura del conjunto de datos.
¿Cómo puedo reconocer el uso del conjunto de datos Fashion-MNIST en mi investigación?
Si utiliza el conjunto de datos Fashion-MNIST en sus proyectos de investigación o desarrollo, es importante reconocerlo enlazando al repositorio de GitHub. Esto ayuda a atribuir los datos a Zalando Research, quien puso el conjunto de datos a disposición del público.