Link to this sectionConjunto de datos Fashion-MNIST#
El conjunto de datos Fashion-MNIST es una base de datos de imágenes de artículos de Zalando, que consta de un conjunto de entrenamiento de 60.000 ejemplos y un conjunto de prueba de 10.000 ejemplos. Cada ejemplo es una imagen en escala de grises de 28x28, asociada con una etiqueta de 10 clases. Fashion-MNIST está diseñado para servir como reemplazo directo del conjunto de datos original MNIST para evaluar machine learning algoritmos.
Link to this sectionCaracterísticas clave#
- Fashion-MNIST contiene 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba de imágenes de artículos de Zalando.
- El conjunto de datos comprende imágenes en escala de grises de un tamaño de 28x28 píxeles.
- Cada píxel tiene un único valor de píxel asociado, que indica la luminosidad u oscuridad de ese píxel, donde los números más altos significan más oscuro. Este valor de píxel es un entero entre 0 y 255.
- Fashion-MNIST es ampliamente utilizado para el entrenamiento y las pruebas en el campo del machine learning, especialmente para tareas de clasificación de imágenes.
Link to this sectionEstructura del dataset#
El conjunto de datos Fashion-MNIST se divide en dos subconjuntos:
- Conjunto de entrenamiento: Este subconjunto contiene 60.000 imágenes utilizadas para entrenar modelos de machine learning.
- Conjunto de prueba: este subconjunto consta de 10 000 imágenes utilizadas para probar y evaluar los modelos entrenados.
Link to this sectionEtiquetas#
Cada ejemplo de entrenamiento y prueba se asigna a una de las siguientes etiquetas:
0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle bootLink to this sectionAplicaciones#
El conjunto de datos Fashion-MNIST es ampliamente utilizado para entrenar y evaluar modelos de deep learning en tareas de clasificación de imágenes, tales como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) y otros algoritmos de machine learning. El formato simple y bien estructurado del conjunto de datos lo convierte en un recurso esencial para investigadores y profesionales en el campo del machine learning y computer vision.
Link to this sectionUso#
Para entrenar un modelo CNN en el conjunto de datos Fashion-MNIST durante 100 epochs con un tamaño de imagen de 28x28, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Training del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)Link to this sectionMuestras de imágenes y anotaciones#
El conjunto de datos Fashion-MNIST contiene imágenes en escala de grises de imágenes de artículos de Zalando, proporcionando un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos Fashion-MNIST, destacando la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.
Link to this sectionAgradecimientos#
Si utilizas el conjunto de datos Fashion-MNIST en tu trabajo de investigación o desarrollo, por favor reconoce el conjunto de datos incluyendo un enlace al GitHub repository. Este conjunto de datos fue puesto a disposición por Zalando Research.
Link to this sectionFAQ#
Link to this section¿Qué es el conjunto de datos Fashion-MNIST y en qué se diferencia de MNIST?#
El conjunto de datos Fashion-MNIST es una colección de 70.000 imágenes en escala de grises de imágenes de artículos de Zalando, pensada como un reemplazo moderno para el conjunto de datos MNIST original. Sirve como referencia para modelos de machine learning en el contexto de tareas de clasificación de imágenes. A diferencia de MNIST, que contiene dígitos escritos a mano, Fashion-MNIST consiste en imágenes de 28x28 píxeles categorizadas en 10 clases relacionadas con la moda, como camiseta/top, pantalón y botín.
Link to this section¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Fashion-MNIST?#
Para entrenar un modelo Ultralytics YOLO en el conjunto de datos Fashion-MNIST, puedes utilizar tanto comandos de Python como de CLI. Aquí tienes un ejemplo rápido para empezar:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n-cls.pt")
# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)Para obtener parámetros de entrenamiento más detallados, consulta la página de Training.
Link to this section¿Por qué debería utilizar el conjunto de datos Fashion-MNIST para evaluar mis modelos de machine learning?#
El conjunto de datos Fashion-MNIST es ampliamente reconocido en la comunidad de deep learning como una alternativa robusta a MNIST. Ofrece un conjunto de imágenes más complejo y variado, lo que lo convierte en una excelente opción para evaluar modelos de clasificación de imágenes. La estructura del conjunto de datos, que comprende 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba, cada una etiquetada con una de las 10 clases, lo hace ideal para evaluar el rendimiento de diferentes algoritmos de machine learning en un contexto más desafiante.
Link to this section¿Puedo usar Ultralytics YOLO para tareas de clasificación de imágenes como Fashion-MNIST?#
Sí, los modelos Ultralytics YOLO pueden usarse para tareas de clasificación de imágenes, incluidas aquellas que involucran el conjunto de datos Fashion-MNIST. YOLO26, por ejemplo, admite diversas tareas de visión como detección, segmentación de instancias, semantic segmentation, clasificación, estimación de pose y detección orientada de objetos. Para comenzar con tareas de clasificación de imágenes, consulta la página de Classification.
Link to this section¿Cuáles son las características clave y la estructura del conjunto de datos Fashion-MNIST?#
El conjunto de datos Fashion-MNIST se divide en dos subconjuntos principales: 60.000 imágenes de entrenamiento y 10.000 imágenes de prueba. Cada imagen es una imagen en escala de grises de 28x28 píxeles que representa una de las 10 clases relacionadas con la moda. La simplicidad y el formato bien estructurado lo hacen ideal para entrenar y evaluar modelos en tareas de machine learning y computer vision. Para más detalles sobre la estructura del conjunto de datos, consulta la sección de Dataset Structure.
Link to this section¿Cómo puedo reconocer el uso del conjunto de datos Fashion-MNIST en mi investigación?#
Si utilizas el conjunto de datos Fashion-MNIST en tus proyectos de investigación o desarrollo, es importante reconocerlo incluyendo un enlace al GitHub repository. Esto ayuda a atribuir los datos a Zalando Research, quienes pusieron el conjunto de datos a disposición para uso público.